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® Hepatitis C Virus Zellkultursystem 

(57) Das erfindungsgemafce Hepatitis C Virus (HCV) Zellkul- 
tursystem besteht aus humanen Hepatomazellen, die mit 
einem HCV-RNA-Konstrukt transfiziert sind, das die HCV- 
spezifischen RNA-Abschnitte 5'NTR, NS3, NS4A, NS4B, 
NS5A, NS5B und 3'NTR und zudem wenigstens ein selek- 
tierbares Markergen (Selektionsgen) umfafct. 
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Beschreibung 

Die Erfindung betrifft ein Hepatitis C Virus (HCV) Zelikultursystem, das im wesentlichen eukaryontische Zellen um- 
faBt, die eingeschleustes HCV-spezifisches Genmaterial enthalten, d. h. die mit HCV-spezifischern Genmaterial transfi- 
5 ziert sind. 

Das Hepatitis C Virus (HCV) ist eine der Hauptursachen chronischer und sporadischer Lebererkrankungen weltweit. 
Die meisten HCV-InfekUonen verlaufen ohne erkennbare ldinische Symptome, allerdings werden.80-90% der Infizier- 
ten dauerhafte Virustrager und bei 50% dieser dauerhaften Virustrager komrnt es zu einer chronischen Leberentziindung 
mit unterschiediichen Schweregraden. Ca. 20% der chronisch Infizierten entwickeln im Laufe von 10 bis 20 Jahren eine 

10 Leberzirrhose, auf deren Basis sich ein primares Leberzellkarzinom entwickeln kann. Die chronische Hepatitis C ist 
heute die Hauptindikation fur eine Lebertransplantauon. Eine Kausaltherapie gibt es bisher noch nicht. Die einzige der- 
zeit verfugbare Therapie ist die hochdosierte Verabreichung von Interferon- Alpha oder eine Kombination aus Interferon- 
Alpha und dem Purin-Nukleosidanalogon Ribavirin. Allerdings sprechen nur ca. 60% aller Behandelten auf diese The- 
rapie an und bei diesen komrnt es in mehr als der Halfte aller Falle nach dem Absetzen der Behandlung zu einer erneuten 

15 Viramie. 

Aufgrund der hohen Pravalenz, gerade auch in den Industrielandern, den schwerwiegenden Folgen chronischer Infek- 
tionen und dem Fehlen einer Kausaltherapie ist die Entwicklung einer HCV-spezifischen Chemotherapie ein wesentli- 
ches Ziel der pharmazeutischen Forschung und Entwicklung. Hauptproblem hierbei ist bisher das Fehlen eines geeigne- 
ten Zellkultursy stems, das ein Studium der Virus-Replikation und der Pathogenese in eukaryontischen Zellen ermog- 
20 licht. 

Aufgrund der geringen Virusmengen im Blut bzw. Gewebe, dem Fehlen geeigneter Zellkultursysteme oder Tiermo- 
delle (bis heute ist der Schimpanse das einzige mogliche Versuchstier) sowie dem Fehlen effizienter Systeme zur Produk- 
tion virus-ahnlicher PartikeL, konnte die molekulare Zusammensetzung des HCV-Partikels bis heute noch nicht einge- 
hend untersucht bzw. aufgeklart werden. Die derzeit vorliegenden Ergebnisse lassen sich wie folgt zusammenfassen: Das 

25 HCV ist ein umhulltes Plusstrang RNA Virus mit einem Partikeldurchmesser von 50-60 nm und einer mittleren Dichte 
von 1,03-1,1 g/ml. Es wurde erstmals 1989 molekular kloniert und charakterisiert (Choo et al., 1989: Science, 244, 
359-362). Die HCV-RNA hat eine Lange von ca. 9.6 kb (= 9600 Nukleotide), eine positive Polaritat und besitzt ein ein- 
ziges offenes Leseraster (ORF = open reading frame), das ein lineares Polyprotein von ca. 3010 Aminosauren kodiert 
(siehe Rice 1996, in Virology, B.N. Fields, D. M. Knipe, P. M. Howley, Eds. (Lippincott-Raven, Philadelphia, PA, 

30 1 996), vol. 1, pp. 931-960; Clarke 1997, J. Gen. Virol. 78, 2397; und Bartenschlager 1997, Intervirology 40, 378 und vgl. 
Fig. 1A). Bei der Virusreplikation wird das Polyprotein durch zellulare und virale Proteasen in die reifen und funktionell 
aktiven Proteine gespalten. 

Innerhalb des Polyproteins sind die Proteine wie folgt angeordnet (vom Amino- zum Carboxyterminus): Core-El -E2- 
p7-NS2-NS3-NS4A-NS4B-NS5A-NS5B. Das Core-Protein ist die Hauptkomponente des Nukleokapsids. Die Glyko- 

35 proteine El und E2 sind Transmembranproteine und Hauptkomponenten der Virushulle. Sie spielen wahrscheinlich bei 
der Anheftung des Virus an die Wirtszelle eine wesentliche Rolle. Diese drei Proteine Core, El und E2 bauen den Vi- 
ruspartikel auf und werden deshalb als Strukturproteine bezeichnet. Die Funkuon des Proteins p7 ist noch unklar. Das 
Protein NS2 ist wahrscheinlich die katalytische Domane der NS2-3 Protease, die fur die Prozesierung zwischen den Pro- 
teinen NS2 und NS3 verantwonlich ist. Das Protein NS3 hat zwei Funktionen, namlich in der aminoterminalen Domane 

40 eine Proteaseaktivitat, die fur die Polyproteinprozessierung essentiell ist, und in der carboxyterminalen Domane eine 
NTPase/Helikase-Funktion, die wahrscheinlich bei der Replikation der viralen RNA eine Rolle spielt. Das Protein NS4A 
ist ein Kofaktor der NS3-Protease. Die Funktion des Proteins NS4B ist unbekannt. 

Das offene Leseraster ist an seinem 5TEnde von einer ca. 340 Nukleotide langen nichttranslatierten Region (NTR = 
non-translated region) fiankiert, die als interne Ribosomenansatzstelle (IRES = internal ribosome entry site) fungiert, und 

45 an seinem 3'Ende von einer ca. 230 Nukleotide langen NTR, die hochstwahrscheinlich fur die Genomreplikation von Be- 
deutung ist. Eine solche 3*NTR ist Gegenstand der Patentanmeldung PCT/US 96/14033. Die Strukturproteine in dem 
aminoterminalen Viertel des Polyproteins werden von der Signalpeptidase der Wirtszelle gespalten. Die Nicht- Struktur- 
proteine (NS) 2 bis (NS) 5B werden von zwei viralen Enzymen prozessiert, namlich von der NS2-3 und der NS3/4A Pro- 
teinase. Die NS3/4A Proteinase wird fur alle Spaltungen jenseits des Carboxyterminus von NS3 benoUgt. Die Rolle von 

50 NS4B ist nicht bekannt. NS5A, ein hoch phosphoryliertes Protein, scheint fur die Interferon Resistenz verschiedener 
HCV-Genotypen verantwortlich zu sein (vgl. Enomoto et al. 1995, J. Clin. Invest. 96, 224; Enomoto et al. 1996, N. Engl. 
J. Med. 334, 77; Gale Jr. et al. 1997, Virology 230, 217; Kaneko et al. 1994, Biochem. Biophys. Res. Commun. 205, 320; 
Reed et al., 1997, J. Virol. 71, 7187) und NS5B wurde als die RNA-abhangige RNA Polymerase identifiziert. 

Anhand dieser Erkenntnisse wurden erste Diagnosesysteme entwickelt, die entweder auf dem Nachweis von HCV- 

55 spezifischen Antikorpem in Patientenserum oder auf dem Nachweis von HCV-spezifischer RNA mittels RT-PCR (= Re- 
verse Transcription Polymerase Chain Reaction) beruhen, und die mittlerweile routine- und/oder vorschriftsmaBig bei al- 
ien Blutkonserven angewendet werden (miissen). 

Seit der Erstbeschreibung des Genoms 1989 wurden mit Hilfe der PCR-Methode zahlreiche Teil- und Komplettse- 
quenzen des HCV kloniert und charakterisiert. Ein Vergleich dieser Sequenzen zeigt eine hohe Variability des viralen 

60 Genoms, insbesondere im Bereich des NS5B-Gens, was letztendlich zu einer Einteilung in 6 Genotypen gefuhrt hat, die 
selbst nochmals in Subtypen a, b, und c untergliedert sind. Die genomische Varianz ist nicht gleichmaBig uber das Ge- 
nom verteilt. So sind die 5*NTR und Teile der 3'NTR hoch konserviert, wahrend bestimmte kodierende Sequenzen z. T. 
sehr stark variieren, vor allem die Hullproteine El und E2. 

Die klonierten und charakterisierten Teil- und Komplettsequenzen des HCV-Genoms wurden auBerdem hinsichtlich 

65 geeigneter Angriffsziele fur ein prospektives antivirales Therapeutikum untersucht. Dabei wurden drei virale Enzyme 
gefunden, die sich als solches Angriffsziel anbieten. Diese sind (1) der NS3/4A Proteasekomplex, (2) die NS3 Helikase 
und (3) die NS5B RNA-abhangige RNA Polymerase. Der NS3/4A Proteasekomplex und die NS3 Helikase konnten be- 
reits kristallisiert und hinsichtlich ihrer dreidimensionalen Struktur aufgeklart werden (Kim et al., 1996, Cell, 87,343; 
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Yem et al., 1998, Protein Science, 7, 837; Love et aL, 1996, Cell, 87, 311; Kim et al, 1998, Structure, 6, 89; Yao et al., 
1997, Nature Structural Biology, 4, 463, Cho et al., 1998, J. Biol. Chem., 273, 15045); bei der NS5B RNA-abhangigen 
RNA Polymerase ist dies bis heute noch nicht gelungen. 

Obwohl mit diesen Enzymen bedeutsame AngrifFsziele fur eine Therapieentwicklung der chronischen HCV-Infektion 
definiert sind, und obwohl sowohl mit Hilfe von "rational drug design" als auch mit Hilfe von "high throughput screens" 5 
weltweit intensiv nach geeigneten Inhibitoren gesucht wird, leidet die Therapieentwicklung an einem groBen Defizit, 
namlich dem Fehlen von Zellkultursystemen oder einfachen Tiermodellen, die es erlauben, HCV-RNA oder HCV- Anti- 
gene direkt, zuverlassig und mit einfachen laborublichen Methoden nachzuweisen. Das Fehlen solcher Zellkultursy- 
steme ist auch der Hauptgrund dafur, daB das Verstandnis der HCV-Replikation bis heute noch sehr luckenhaft und in 
weiten Teilen nur hypothedsch ist. 10 

Obwohl nach Meinung der Fachwelt eine enge evolutionare Beziehung zwischen HCV und den Ravi- und Pestiviren 
besteht und fur diese autonom replizierende RNAs beschrieben sind, die in verschiedenen Zellinien ohne wei teres zur 
Replikation gebracht werden konnen und dabei relativ hohe Ausbeuten zeigen (siehe Khromykh et al., 1997, J. Virol. 71, 
1497; Behrens et al., 1998, J. Virol. 72, 2364; Moser et al., 1998, J. Virol. 72, 5318), waren ahnliche Versuche mit HCV 
bisher nicht erfolgreich. 15 

Zwar ist aus verschiedenen Publikationen bekannt, daB Zellinien oder primare Zellkulturen mit HCV-haltigem, hoch- 
titrigem Patientenserum infiziert werden konnen, (Lanford et al. 1994, Virology 202, 606; Shimizu et al 1993, Proce- 
dings of the National Academy of Sciences, USA, 90, 6037-6041; Mizutani et al. 1996, Journal of Virology, 70, 
7219-7223; M. Ikeda et al. 1998, Virus Res. 56, 157; Fournier et al. 1998, J. Gen. Virol. 79, 2376 und darin zitierte Li- 
ter aturstellen, Ito et al. 1996, Journal of General Virology, 77, 1043-1054), diese virusinfizierten Zellinien oder Zellkul- 20 
turen erlauben jedoch nicht den direkten Nachweis von HCV-RNA oder HCV-Antigenen. Die virale RNA in diesen Zel- 
len ist weder in einem Northem-Blot (einem Standardverfahren zum quantitativen Nachweis von RNA) noch sind die vi- 
ralen Protein in einem Western-Blot oder mittels Immunprazipitation detektierbar. Nur mit sehr aufwendigen und indi- 
rekten Methoden ist es uberhaupt gelungen, eine HCV-Replikation nachzuweisen. Diese nachteiligen Umstande zeigen 
klar, daB die Replikation in diesen bekannten virusinfizierten Zellinien oder Zellkulturen absolut unzureichend ist. 25 

Desweiteren ist aus den Publikationen von Yoo et al. (1995, Journal of Virology, 69, 32-38) und von Dash et al., 
(1997, American Journal of Pathology, 151, 363-373) bekannt, daB Hepaiomazeliinien mit synthetischer HCV-RNA, die 
mittels in vitro Transkription von kloniertem HCV-Genom gewonnen wurde, transfiziert werden konnen. In beiden Pu- 
blikationen gingen die Autoren von dem Grundgedanken aus, daB das virale HCV-Genom eine Plusstrang-RNA ist, die 
nach dem Einschleusen in die Zelle direkt als mRNA fungi ert, an die sich Ribosomen anheften und im Zuge von Trans- 30 
lationsprozessen Virusproteine bilden, aus denen sich letztendlich neue HCV-Partikel bilden (konnen). Diese Virusrepli- 
kation, d. h. diese neu gebildeten HCV- Viren bzw. deren RNA wurde mittels RT-PCR nachgewiesen. Die publizierten Er- 
gebnisse der durchgefuhrten RT-PCR sprechen jedoch dafur, daB die Effizienz der HCV-Replikation in den beschriebe- 
nen HCV-transfizierten Hepatomazellen nur sehr gering ist und jedenfalls nicht ausreicht, um Schwankungen in der Re- 
plikation srate nach gezielter Einwirkung mit prospektiven antiviralen Therapeutika auch nur qualitativ, geschweige denn 35 
quantitativ zu messen. 

Aufgabe der vorliegenden Erfindung ist die Bereitstellung eines HCV-Zellkultursy stems, bei dem die virale RNA in 
den transfizierten Zellen autonom und mit so hoher Effizienz repliziert, daB Schwankungen in der Replikauonsrate nach 
gezielter Einwirkung mit virus- und insbesondere HCV-spezifischen prospektiven antiviralen Therapeutika qualitativ 
und quantitativ und mit Hilfe gangiger, laborublicher MeBverfahren gemessen werden konnen. 40 

Eine Losung dieser Aufgabe besteht in der Bereitstellung eines Zellkultursystems der eingangs genannten Art, bei 
dem die eukaryontischen Zellen humane Hepatomazellen sind, die vorzugsweise von einer handelsiiblichen Hepatoma- 
zellinie abstammen, aber auch aus einer entsprechenden Primarzellkultur gewonnen sein konnen, und bei dem das ein- 
geschleuste HCV-spezifische Genmaterial ein HCV-RNA-Konstrukt ist, das die HCV-spezifischen RNA-Abschnitte 
5'NTR, NS3, NS4A, NS4B, NS5A, NS5B und 3'NTR, vorzugsweise in der genannten Reihenfoige, und zudem wenig- 45 
stens ein selektierbares Markergen (Selektionsgen) urnfaBt. 

"NTR" steht hier und im folgenden fur "nicht translatierte Region" und ist dem einschlagigen Fachmann als Begriff 
bzw. Abkurzung bekannt und gelaufig. 

Der Begriff "HCV-RNA-Konstrukt" urnfaBt hier und im folgenden sowohl Konstrukte, die das komplette HCV-Ge- 
nom enthalten, als auch solche, die lediglich einen Teil davon, d. h. ein HCV-Subgenom enthalten. 50 

Eine bevorzugte Variante des erfindungsgemaBen Zellkultursystems, die sich in der Praxis sehr gut bewahrt hat, tragt 
ist unter der Nummer DSM ACC2394 (Laborbezeichnung HuBl 9-13) bei der DSMZ, Deutsche Sammlung von Mi- 
kroorganismen und Zellkulturen GmbH in Braunschweig, Deutschland, hinterlegt. 

Mit dem erfindungsgemaBen Zellkul tursy stem wird erstmals ein in-vitro-System bereit gestellt, in dem HCV-RNA in- 
trazellular, autonom und in ausreichend groBen Mengen repliziert und exprimiert wird, so daB eine quantitative Bestim- 55 
mung sowohl der HCV-RNA -Mengen als auch der HCV-spezifischen Proteine mit konventionellen und zuverlassig ge- 
nauen biochemischen MeBmethoden durchgefuhrt werden kann. Das heiBt: es steht erstmals ein annahemd authentisches 
zellgestutztes ("cell-based") HCV- Replikationssy stem zur Verfugung, das fur die Entwicklung und Erprobung von anti- 
viralen Pharmazeutika dringend benotigt wird. Dieses Testsystem bietet nun die Moglichkeit, potentielle Angriffsziele 
fur eine wirksame HCV-spezifische Therapie zu identifizieren und HCV-spezifische Chemotherapeutika zu entwickeln 60 
und zu evaluieren. 

Die Erfindung basiert auf der uberraschenden Erkenntnis, daB eine effiziente Replikation der HCV-RNA nur dann in 
Zellen stattfindet, wenn diese mit einem HCV-RNA-Konstrukt transfiziert wurden, das mindestens die 5' und die 3' nicht- 
translatierten Regionen (NTR) und die Nichtstrukturproteine (NS) 3 bis 5B urnfaBt und zusatzlich ein selektierbares 
Markergen (Selektionsgen) aufweist. Offensichtlich sind die Strukturgene fur den Ablauf der Replikation ohne wesent- 65 
liche Bedeutung, wahrend andererseits eine effiziente Replikation der HCV-RNA anscheinend nur dann stattfindet, wenn 
die transfizierten Zellen einem permanenten Selektionsdruck unterzogen werden, der durch das mit der HCV-RNA ver- 
bundene selektierbare Markergen (Selektionsgen) vermittelt wird. Das Markergen (Selektionsgen) scheint somit einer- 
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seits die Selektion derjenigen Zellen zu provozieren, in denen die HCV-RNA produktiv repliziert, und andererseits 
scheint es die Effizienz der RNA-Replikation wesendich zu steigem. ; 

Gegenstand der Erfindung ist auch ein zellfreies HCV-RNA-Konstrukt, das sich dadurch auszeichnet, daB es die HCV- 
spezifischen RNA-Abschnitte S'NTR, NS3, NS4A, NS4B, NS5A, NS5B und 3*NTR, vorzugsweise in der genannten Rei- 
5 henfolge, und zudem ein selektierbares Markergen (Selektionsgen) umfaBt. 

Der Begriff S'NTR bzw. NS3 bzw. NS4A bzw. NS4B bzw. NS5A bzw. NS5B bzw. 3*NTR umfaBt im vorliegenden Zu- 
sammenhang jede Nukleotidsequenz, die im Stand der Technik als Nukleotidsequenz fur den jeweils betreffenden funk- 
tionellen Abschnitt des HCV-Genoms beschrieben ist. 

Die Bereitstellung eines solchen HCV-RNA-Konstrukts ermoglicht erstmals eine detaillierte Analyse der HCV-Repli- 
10 kation, -Pathogenesis und -Evolution in Zellkulturen. Die HCV-spezifische virale RNA kann - als vollstandiges Genom 
oder als Subgenom - gezielt in beliebigen Mengen erzeugt werden, und es besteht die Moglichkeit, das RNA-Konstrukt 
zu manipulieren und damit die HCV-Funktionen auf genetischer Ebene zu untersuchen und aufzuklaren. 

Da alle zur Zeit als Hauptangriffsziel fur eine Therapie untersuchten HCV-Enzyme, namlich die NS3/4A Protease, die 
NS3 Helikase und die NS5B Polymerase, in dem erfindungsgemaBen HCV-RNA-Konstrukt enthalten sind, kann es fur 
15 alle entsprechenden Untersuchungen benutzt werden. 

Eine Ausfuhrungsform des HCV-RNA-Konstrukts, die sich in der praktischen Anwendung sehr gut bewahrt hat, 
zeichnet sich dadurch aus, daB sie die Nukleotidsequenz gemaB Sequenzprotokoll SEQ ID NO: 1 umfaBt. 

Weitere Ausfuhrungsvarianten mit vergleichbar guten Eigenschaften fur den Einsatz in der Praxis sind dadurch ge- 
kennzeichnet, daB sie eine Nukleotidsequenz entweder gemaB Sequenzprotokoll SEQ ID NO: 2 oder gemaB Sequenz- 
20 protokoll SEQ ID NO: 3 oder gemaB Sequenzprotokoll SEQ ID NO: 4 oder gemaB Sequenzprotokoll SEQ ID NO: 5 
umfassen. 

Es besteht die Moglichkeit, das erfindungsgemaBe HCV-Subgenom-Konstrukt mit einer 37^111 zu versehen, die eine 
im Stand der Technik hierfur bisher unbekannte Nukleotidsequenz aufweist, namlich eine Nukleotidsequenz, die aus der 
Gruppe der nachfolgend aufgelisteten Nukleotidsequenzen (a) bis (i) ausgewahlt ist: 

25 (a) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTTTTTTTA 
GCTTTTTTTTTTTTCTTTTTTTTTGAGAGAGAGAGTCTCACTCTGTTGCCC 
AGACTGGAGT 

30 

(b) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTC TTTTTTTTGA GAGAGAGAGT CTCACTCTGT 
TGCCCAGACT GGAGC 

35 

(c) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTAATCTTT TTTTTTTTCT TTTTTTTTGA GAGAGAGAGT CTCACTCTGT 
TGCCCAGACT GCAGC 

40 

(d) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAGTC TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG AGTCTCACTC 
TGTTGCCCAG ACTGGAGT 

45 

(e) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG AGTCTCACTC 

50 TGTTGCCCAG ACTGGAGT 

(£) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 

TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TTGAGAGAGA GAGTCTCACT 
55 CTGTTGCCCA GACTGGAGT 
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(g) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT ttTTTTTTTT CTTTTTTTTT GAGAGAGAGA 
GTCTC ACTCT GTTGCCCAGA CTGGAGT 

i 5 

(h) ACGGGGAGCTAAAC ACTCC AGGCCAATAGGCC ATCCTGTTTTTT 
TTTTTTTAAT CTTTTTTTTT TTTTTCCTTT TTTTGAGAGA 

GAGAGTCTCA CTCTGTTGCC CAGACTGGAG T l0 

(i) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAATC TTTTTTTTTT TTTTCTTTTT TTTTTGAGAG 

AGAGAGTCTC ACTCTGTTGC CCAGACTGGA GT is 

Das in den erfindungsgemaBen HCV-RNA -Konstrukten enthaltene selektierbare Markergen (Selektionsgen) ist vor- 
zugsweise ein Resistenzgen, insbesondere eine Antibiotikumresistenzgen. 

Das hat den Vorteil, daB die mit diesem Konstrukt transfizierten Zellen leicht von den nicht transfizierten Zellen selek- 
tiert werden konnen, indem dem Zellkulturrnedium z. B. im Fall eines Antibiotikumresistenzgens das betreffende Anti- 20 
biotikum zugegeben wird. Unter "Antibiotikum" wird im vorliegenden Zusammenhang jede Substanz verstanden, die 
die nicht-transfizierten Wirts zellen oder die ZeUen, in denen die HCV-RNA nur mit geringer Effizienz repliziert, am Le- 
ben oder Wachstum hindert, insbesondere Zellgifte wie z. B. Puromycin, Hygromycin, Zeocin, Bleomycin oder Blasti- 
cidin. 

Ein bevorzugtes selektierbares Markergen (Selektionsgen) bzw. Resistenzgen, das sich in der Praxis sehr gut bewahrt 25 
hat, ist das Neomycinphosphotransferasegen. 

Eine Alternative zu den Antibiotikumresistenzgenen ist z. B. das Thymidin-Kinase-Gen, mit dem eine HAT-Selektion 
durchgefuhrt werden kann. 

Die Position des selektierbaren Markergens (Selektionsgens), bzw. des bevorzugten Resistenzgens bzw. des besonders 
bevorzugten Antibiotikumresistenzgens in dem HCV-RNA -Konstrukt liegt vorzugsweise hinter der HCV 5'NTR, d. h. 30 
stran gab warts der 5'NTR bzw. strangauf warts des HCV-Leserasters. Denkbar ist aber auch eine Insertion im Bereich der 
3'NTR oder an anderer Stelle des HCV-Genoms oder -Subgenoms, z. B. innerhalb des Polyproteins. 

Bei einer alternativen Ausfiihrungsform des erfindungsgemaBen HCV-RNA-Konstrukts ist das selektierbare Marker- 
gen (Selektionsgen), insbesondere ein Antibiotikumresistenzgen, iiber ein Ribozym bzw. eine Erkennungsstelle fur ein 
Ribozym mit der HCV-RNA bzw. der HCV-Genom- oder -Subgenomsequenz verbunden. 35 

Damit geht der Vorteil einher, daB nach erfolgter Selektion derjenigen Zellen, in denen die HCV-RNA produktiv re- 
pliziert, in den daraus gewonnenen Zellklonen das Resistenzgen durch ribozymvermittelte Spaltung von der HCV-Sub- 
genomsequenz abgetrennt werden kann, narnlich durch Aktivierung des einklonierten Ribozyms oder, im Fall eines Kon- 
strukts mit einer Erkennungsstelle fiir ein Ribozym, durch Einschleusen des Ribozyms in die Zellen (z. B. mittels Trans- 
fektion eines Ribozymkonstrukts oder Infektion mit einem viralen Expressionsvektor, in den das entsprechende Ribo- 40 
zym eingesetzt wurde). Auf dieseWeise wird ein authentisches HCV-Genom- Konstrukt ohne Resistenzgen erhalten, das 
zur Bildung authentischer infektioser Viruspartikel befahigt ist. 

Eine weitere bevorzugte Ausfuhrungsform des erfindungsgemaBen HCV-RNA-Konstrukts zeichnet sich dadurch aus, 
daB das Konstrukt wenigstens ein integriertes Reportergen aufweist. 

Unter Reportergen wird im folgenden jedes Gen verstanden, dessen An wesenheit sich nach Uberfuhrung in einen Ziel- 45 
organismus leicht und im allgemeinen mit einfachen biochemischen oder auch histochemischen Methoden nachweisen 
laBt, d. h. das fur ein Protein kodiert, welches auch in geringen Mengen einfach und zuverlassig mit den laborublichen 
MeBmethoden nachgewiesen und quanufiziert werden kann. 

Diese Variante des HCV-RNA-Konstrukts hat den Vorteil, daB der Umfang der Replikation dieses Konstrukts an hand 
des Reportergenprodukts einfach und schnell mit laborublichen Methoden gemessen werden kann. 50 

Das Reportergen ist vorzugsweise ein Gen aus der Gruppe der Luziferasegene, dem CAT-Gen (Chloramphenicol- Ace- 
tyl-Transferase- Gen), dem lacZ-Gen (beta-Galaktosidasegen), dem GFP-Gen (green-fluorescence-protein- Gen), dem 
GUS-Gen (Glukuronidasegen) oder dem SEAP-Gen (Sezernerte-Alkalische-Phosphatase-Gen). Diese Reportergene 
bzw. deren Produkte, narnlich die entsprechenden Reporterproteine, konnen z. B. mittels Fluoreszenz, Chemilumines- 
zenz, colon metrisch oder mit Hilfe imrnunologischer Methoden (z. B. ELISA) bestimmt werden. 55 

Als Reportergen kommt aber auch ein Surrogatmarkergen in Betracht Darunter sind in diesem Zusammenhang solche 
Gene zu verstehen, die fur zellulare Proteine, Nukleinsauren oder - allgemein - fur solche Funktionen kodieren, die einer 
von der Virusreplikation abhangigen Variation unterliegen, und die infolgedessen in denjenigen Zellen, in denen sich das 
HCV bzw. das HCV-RNA-Konstrukt vermehrt, entweder reprimiert oder aktiviert werden. Das heiBt: die Reduktion bzw. 
Aktivierung dieser Funktion ist ein Ersatzmarker fiir die Virusreplikation bzw. die Replikation des HCV-RNA-Kon- 60 
strukts. 

Die Positionen von Reportergen und selektierbarem Markergen (Selektionsgen) konnen so gewahlt sein, daB ein aus 
den beiden Genprodukten gebildetes Fusion sprotein exprimiert wird. Hierbei besteht die vorteilhafte Moglichkeit, daB 
diese beiden Gene so in dem HCV-RNA-Konstrukt angeordnet sind, daB ihre beiden exprimierten Proteine zunachst iiber 
eine Schnittstelle fiir eine Protease (z. B. Ubiquitin) oder iiber ein selbstspaltendes Peptid (z. B. das 2A-Protein der Pi- 65 
cornaviren) fusioniert sind und erst spater proteolytisch wieder getrennt werden. 

Ebensogut konnen diese beiden Positionen aber auch derart getrennt voneinander liegen, daB beide Genprodukte se- 
parat exprimiert werden. (z. B. in der Reihenfolge: Marker- bzw. Resistenzgen - interne Ribosomenbindungsstelle - Re- 

5 
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portergen). 

Im Fall des Reportergens hat sich eine Ausfuhrungsvariante besonders bewahrt, bei der das Reportergen in das offene 
Leseraster des HCV-Genoms oder -Subgenoms einkloniert ist, und zwar derail, daB es erst nach einer proteolytischen 
Prozessierung in eine aktive Form uberfuhrt wird. 
5 Das erfindungsgemaBe Zellkultursy stern in alien seinen Variationen kann fur vielfaltige Zwecke eingesetzt werden. 
Diese umfassen: 

- Das Auffinden antiviral wirksamer Substanzen. Dies konnen beispielsweise sein: organische Verbindungen, die 
unmittelbar oder mittelbar in die Virusverrnehrung eingreifen (z. B. Inhibitoren der viralen Proteasen, der NS3-He- 

10 likase, der NS5B RNA-abhangigen RNA Polymerase), antisense Oligonukleotide, die an eine beliebige Zielse- 

quenz innerhalb des HCV-RNA-Konstrukts (z. B. die 5*NTR) hybridisieren und unmittelbar oder mittelbar zu einer 
Beeinflussung der Virusverrnehrung fuhren z. B. auf Grund einer Reduktion der Translation des HCV-Polyproteins 
oder Ribozyme, die eine beliebige HCV-RNA-Sequenz spalten und damit die Virusreplikation beeintrachtigen. 

- Die Evaluierung jeglicher Art antiviral wirksamer Substanzen in Zellkultur. Solche Substanzen konnen beispiels- 
15 weise mittels "rational drug design" oder "high- throughput screening" am isolierten gereinigten Enzym gefunden 

werden. Unter Evaluierung sind vor allem die Bestimmung der inhibitorischen Eigenschaften der entsprechenden 
Substanz sowie deren Wirkungsmechanismus zu vers ten en. 

- Die Identification neuer Angriffsziele, viralen oder zellularen Ursprungs, fur eine HCV-spezifische anuvirale 
Therapie. Ist beispielsweise ein zellulares Protein essentiell fur die Virusreplikation, kann mittels Hemmung dieses 

20 zellularen Proteins die Virusreplikation ebenfalls beeinfluBt werden. Das Auffinden solcher auxiliaren Faktoren ist 

mit dem erfindungsgemaBen System ebenfalls moglich. 

- Der Einsatz fur die Resistenzbestimmung. Es ist anzunehmen, daB auf Grund der hohen Mutationsrate des HCV- 
Genoms Therapieresistenzen auftreten. Solche Resistenzen, die gerade bei der klinischen Zulassung einer Substanz 
von groBer Bedeutung sind, lassen sich mit dem erfindungsgemaBen Zellkultursystem ermitteln. Zellinien in denen 

25 sich das HCV-RNA-Konstrukt bzw. das HCV-Genom oder -Subgenom repliziert, werden mit steigenden Konzen- 

trationen der entsprechenden Substanz inkubiert und die Replikation der viralen RNA wird entweder anhand eines 
eingebrachten Reporters oder durch qualitative oder quantitative Bestimmung der viralen Nukleinsauren oder Pro- 
teine bestimmt. Resistenz ist dann gegeben, wenn bei normaler Wirkstoffkonzentration keine Hemmung der Reph- 
kation zu beobachten ist. Durch Reklonierung der HCV-RNA (z. B. mittels RT-PCR) und Sequenzanalyse konnen 

30 die fur Therapieresistenz verantwortlichen Nukleotid- bzw. Aminosaureaustausche ermittelt werden. Durch Einklo- 

nieren der/des entsprechenden Austausches in das Ursprungskonstrukt kann deren Kausalitat fur die Therapieresi- 
stenz bewiesen werden. 

- Die Produktion authentischer Virusproteine (Antigene) fur die Entwicklung und/oder Evaluierung von Diagno- 
stika. Das erfindungsgemaBe Zellkultursystem erlaubt auch die Expression von HCV-Antigenen in Zellkulturen. 

35 Diese Antigene konnen prinzipiell auch fiir den Aufbau diagnostischer Nachweisverfahren eingesetzt werden. 

Das erfindungsgemaBe HCV-RNA-Konstrukt fiir sich genommen kann in alien seinen Variationen ebenfalls fur viel- 
faltige Zwecke eingesetzt werden. Dazu gehoren vor allem: 

40 - Die Konstruktion attenuierter Hepatitis C Viren bzw. HCV-ahnlicher Partikel und deren Produktion in Zellkultu- 

ren: 

Durch zufallige oder gezielt hervorgerufene Mutationen, beispielsweise Punktmutationen, Deletionen oder Insertio- 
nen, konnen attenuierte HCV- oder HCVahnliche Partikel erzeugt werden, d. h. Viren bzw. virusahnliche Partikel 
mit voller Replikationskompetenz aber verringerter bzw. fehlender Pathogenitat. Solche attenuierte HCV- oder 
45 HCV-ahnliche Partikel sind insbesondere als ImpfstofF einsetzbar. 

- Die Konstruktion von HCV-RNA -Konstrukten mit integrierten Fremdgenen, beispielsweise zur Verwendung als 
leberzellspezifische Genfahren in der Gentherapie. Auf Grund des ausgepragten Leberzelltropismus des HCV und 
der Moglichkeit, Teile des Genoms durch heterologe Sequenzen zu ersetzen, lassen sich HCV-RNA-Konstrukte 
herstellen, bei denen beispielsweise die Strukturproteine durch ein therapeutisch wirksames Gen ersetzt werden. 

50 Das so erhaltene HCV-RNA-Konstrukt wird in Zellen eingeschleust, vorzugsweise mittels Transfektion, die die 

fehlenden HCV-Funktionen, beispielsweise die Strukturproteine, konstitutiv oder induzierbar exprimieren. Durch 
diese dem Fachmann unter dem Begriff der "Transkomplementation" bekannte Technik lassen sich Viruspartikel er- 
zeugen, in die das HCV-RNA-Konstrukt eingebaut wird. Die so erhaltenen Partikel konnen fiir die Infektion vor- 
zugsweise von Leberzellen verwendet werden. In diesen wird das therapeutisch wirksame Fremdgen zur Expression 

55 gebracht und entfaltet damit seine therapeutische Wirkung. 

- Das Auffinden permissiver Zellen, d. h. Zellen, in denen eine produktive Virusverrnehrung erfolgt. Zu diesem 
Zweck wird entweder eines der vorgenannten HCV-RNA-Genomkonstrukte verwendet, das zur Bildung kompletter 
infekuoser Viren befahigt ist, oder es wird eines der vorgenannten HCV-Subgenom-Konstrukte eingesetzt, das al- 
lerdings zunachst gemaB vorgenanntem Beispiel in eine Zellinie transfiziert wird, die die fehlenden Funktionen 

60 konstitutiv oder induzierbar exprimiert. In all diesen Fallen entstehen Viruspartikel, die zusatzlich zur HCV-Se- 

quenz ein Resistenz- und/oder Reportergen tragen. Zum Auffinden von Zellen, in denen das HCV replizieren kann, 
werden diese Zellen mit den so herges tell ten Viren infiziert und einer Antibiotikumselektion unterzogen oder, in 
Abhangigkeit vom HCV-RNA-Konstrukt, mittels Nachweis der Expression des Reportergens untersucht. Da eine 
Antibiotikumresistenz bzw. eine Expression des Reportergens nur dann nachweisbar ist, wenn das HCV-RNA-Kon- 

65 strukt repliziert, miissen die so gefundenen Zellen permissiv sein. Auf diese Weise lassen sich nahezu beliebige Zel- 

linien oder primare Zellkulturen hinsichtlich der Permissivitat testen und auffinden. 

Die Erfindung wird im folgenden anhand von Ausfuhrungsbeispielen und dazugehorigen Figuren naher erlautert Es 
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zeigen 

Fig. 1A die Struktur eines erfindungsgemaBen HCV-RNA-Konstrukts Ganz oben ist eine schemalische Darstellung 
der Struktur des kompletten parentalen HCV-Genoms gegeben mit den Positionen der Gene fur die Spaltungsprodukte 
core, El, E2, p7, NS2, NS3, NS4A, NS4B, NS5A und NS5B innerhalb des Polyproteins, und den 5' und 3' nichttransla- 
tierten Regionen (5'NTR und 3'NTR) - als Horizontalbalken dargestellt -, und mit den beiden fur die Erzeugung der Sub- 5 
genom-Konstrukte ausgewahlten Positionen, namlich der Position der "GDD-katalytischen Domane" der NS5B RNA 
Polymerase (GDD) und der Position der 3'Grenze der HCV-IRES (Nukleotidpositionen 1 bis 377 bzw, 1 bis 389) - ober- 
halb des Genomschemas eingezeichnet-. Die Zahlen unterhalb des Genomschemas bezeichnen die entsprechenden Nu- 
kleotidpositionen. 

Darunter sind schematische Darstellungen der Strukturen zweier erfindungsgemaBer, modifizierter HCV-RNA-Kon- 10 
strukte (Subgenom) gezeigt, bestehend aus der 5'HCV-IRES, dem Neomycinphosphotransferasegen (Neo R ), der EMCV- 
IRES (E-I) und den HCV Sequenzen von NS2 bzw. NS3 bis zum authentischen 3*Ende. Die Position der das NS5B Po- 
lymerase GDD-Motiv umfassenden 10 Arninosauren-Deletion ist jeweils mit einem Dreieck (A) markiert; 

Fig. IB das Ergebnis einer denaturierenden Formaldehyd-Agarose-Gelelektrophorese zum Nachweis von replizierter 
Plusstrang-RNA in transfizierten subpassagierlen Huh-7 Zellklonen. is 
Die Positionen der HCV-spezifischen RNAs (Pfeile) und der 28S rRNA sind rechts von Spur 12 angegeben, die GroBen 
(An zahlen der Nukleotide) der RNA-Marker (M) sind links von Spur 1 angegeben; 

Fig. 1C das Ergebnis eines PCR-Tests mit nachfolgendem Southern-Blot zum Nachweis der Abwesenheit von inte- 
grierter Replikon-DNA in den meisten der selektierten Zeliklone. 

Spuren 1 und 2 zeigen die Positivkontrollen, Spur 13 die Negativ-Kontrolle. Die Zahlenangaben links der Spur 1 be- 20 
zeichnen die GroBe der Nukleotid-Marker-Molekule; 

Fig. 2A das Ergebnis eines PCR-Tests mit nachfolgendem Southern-Blot zum sensitiven AusschluB integrierter Repli- 
kon-DNA (Plasmid Molekule I 3 77/NS3-3Vwt) in einem HCV-RNA-Kon strukt-haltigen Zellklon (9-13). 
Die Spuren 7 bis 1 1 reprasentieren das Ergebnis einer Titration von DNA-Molekiilen des Konstrukts I 37 7/NS3-37wt ohne 
Zugabe von Gesamt-DNA des Zellklons 9-1 3 und die Spuren 2-6 reprasentieren die gleichen Plasmidmolekule mit Zug- 25 
abe von jeweils 1 ug 9-13 DNA vor der PCR (zwecks AusschluB eines Inhibitors der PCR in der DNA-Praparation). Spur 
13 reprasentiert die Negativ-Kontrolle (PCR ohne DNA-Sonde). Spur 1 zeigt das Ergebnis, das mit einem ug Gesamt- 
DNA des Zellkons 9-13 erhalten wurde; 

Fig. 2B das Ergebnis eines Northem-Blot-Tests zur Quantifizierung von HCV Plus- und Minusstrang RNA. 
Die Pfeile markieren die Positionen von Replikon-RNA. 30 
Die "plus"- und "minus"-Abgaben bezeichnen die positive (plus) bzw. negative (minus) Polaritat der RNA-Kontrollen, 
die auf das Gel aufgetragen wurden. "Minusstrand" und "Plusstrand" bezeichnen die Spezifitat der radioaktiven RNA- 
Sonden; 

Fig. 2C Ergebnis einerFormaldehyd-Agarose-Gelelektrophorese nach radioaktiver Markierung der intrazellular repli- 
zierten HCV-RNA zum Nachweis der Resistenz der HCV-RNA-Replikation gegen Dactinomycin; 35 

Fig. 3 A Nachweis von HCV-spezifischen Antigenen in den selektierten Zellklonen mittels Immunoprazipitation nach 
metabolischer Radioaktivmarkierung. 

Die Spuren 7-9 reprasentieren authentische GroBenmarker (die nach transienter Expression eines HCV-RNA-Konstrukts 
in Huh-7-Zellen erhalten wurden); identifizierte HCV-Proteine sind am linken Rand von Spur 1 markiert, die Molekular- 
gewichte (in Kilodalton) sind am rechten Rand von Spur 9 angegeben; 40 

Fig. 3B Ergebnisse eines Immunfluoreszenztests zum Nachweis der subzellularen Lokalisation von HCV Antigenen; 

Fig. 4 schematische Darstellung der Struktur eines erfindungsgemaBen selektierbaren HCV-RNA-Konstrukts (kom- 
plettes Genom) bestehend aus der 5'HCV-IRES, dem Neomycinphosphotransferasegen (NeoR), einem heterologen 
IRES-Element, z. B. des Encephalomyocarditis virus (E-I), dem vollstandigen HCV-Leseraster und der authentischen 
3'NTR; * " 45 

Fig. 5 schematische Darstellung der Struktur von HCV-RNA-Konstrukten mit insertiertem Antibiotikumresistenzgen 
(A) innerhalb der fur das Polyprotein kodierenden Nukleotidsequenz (monocistronische RNA), und (B) innerhalb der 
3'NTR (bicistronische RNA); 

Fig. 6 schematische Darstellung der Struktur von HCV-RNA-Konstrukten mit insertiertem Reportergen (A) als Teil 
eines HCV-Replikons von NS3 bis NS5B; - das Reporterprotein wird letztendlich durch virale oder durch zellulare Pro- 50 
teasen aus dem Polyprotein gespalten und das selektierbare Markergen (Selektionsgen) bzw. das Resistenzgen durch 
Kontransfektion in die Zellen einschleust, (B) als Teil eines Fusionsgens aus Resistenz- und Reportergen (z. B. fur die 
Neomycinphosphotransferaseund green fluorescent Protein) (C) als Teil eines Replikons aus Resistenz- und Reportergen 
(z. B. fur die Neomycinphosphotransferase und das green fluorescent Protein), die iiber eine Nukleotidsequenz verbun- 
den sind, welche fur eine Aminosauresequenz kodiert (schrafflerter Bereich), die von einer Protease gespalten werden 55 
kann oder die iiber eine selbstspaltende (autokatalytische) Aktivitat verfugt, ( A ) als unabhangiges Gen (hier green fluo- 
rescent protein), das von einer eigenen intemen Ribosomenbindungsstelle (IRES) aus exprimiert wird; - das Resistenz- 
gen (hier: Neomycinphosphotransferase-Gen) wird davon unabhangig ebenfalls von einer eigenen intemen Ribosomen- 
bindungsstelle (IRES) aus exprimiert (polycistronisches Konstrukt); 

Fig. 7 schematische Darstellung der Struktur eines HCV-RNA-Konstrukts bei dem das Resistenzgen iiber ein Ribo- 60 
zym bzw. eine Erkennungss telle fur ein Ribozym mit der HCV-RNA-Sequenz verbunden ist. 

Die dicken Linien stellen die HCV 5'- und 3'NTRs dar, E-I ist eine heterologe interne Ribosomenbindungsstelle, die fur 
die Expression des Resistenzgens notwendig ist, und das graue Quadrat stellt das Ribozym bzw. eine Erkennungsstelle 
fur ein Ribozym dar; 

Fig. 8 schematische Darstellung der Struktur eines HCV-RNA-Konstrukts mit Resistenzgen und integriertem Fremd- 65 
gen. 
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Beispiel 1 

Herstellung von HGV-RNA-Konstrukten 

5 (A) Synthese und Klonierung eines vollstandigen HGV-Konsensusgenoms mittels RT-PCR 

Aus der Leber eines chronisch infizierten Patienten wurde das HCV-Genom, d. h. die HGV-RNA wie nachfolgend be- 
schrieben isoliert: 

Aus ca. 100 mg Leber wurde die komplette RNA gemaB dem Verfahren von Chomczynski und Sacci (1987, Anal. 

io Biochem. 162, 156) isohert. Mit 1 ug dieser isolierten RNA wurde eine reverse Transkription mit den Primem A6103. 
(GCTATCAGCCGGTTCATCCA CTGC) oder A9413 (C A GG ATGGCCTATTGG CCTGGAG) und dem "expand re- 
verse transcriptase"- System (Boehringer Mannheim, Deutschland) nach den Vorschriften des Herstellers durchgefuhrt. 
Mit den Produkten dieser reversen Transkription (RT) wurde eine Polymerase-Kettenreaktion (PGR = polymerase chain 
reaction) durchgefuhrt, und zwar unter Verwendung des "expand long template "-Systems (Boehringer Mannheim, 

15 Deutschland), wobei der Puffer mit 2% Dimethylsulfoxid-Gehalt eingesetzt wurde. Nach einer Stunde bei 42°G wurde 
1/8 dieses Reaktionsansatzes in einem ersten PCR-Durchgang mit den Primern A6103 und S59 (TGTCTTGAGGCA- 
GAAAGGGTCTAG) oder A9413 und 54542 (GATGAGCT GGGGGCGAAGGTGTGG) eingesetzt. Nach 40 Zyklen 
wurde 1/10 dieses Reaktionsansatzes in einem zweiten PCR-Durchgang mit den Primern S59 und A4919 (AGCA- 
CAGCCCGCGTCATAGCACTCG) oder 54542 und A9386 (TTAGCTCCCCG TTCATCGGTTGG) eingesetzt. Nach 

20 30 Zyklen wurden die PCR-Produkte mittels praparativer Agarose-Gel-Elektrophorese gereinigt und die dabei eluierten 
Fragmente wurden in den Vektor pCR2.1 (Invitrogen) oder pBSK n (Stratagene) ligiert. Vier Klone von jedem Fragment 
wurden analysiert und sequenziert, und es wurde eine Konsensus-Sequenz ermittelt. Zu diesem Zweck wurden die DNA- 
Sequenzen miteinander verg lichen. Die Positionen, an denen sich die Sequenz eines der Fragmente von den ubrigen un- 
terschied, wurde als unerwunschte Mutation betrachtet. Im Fall von Mehrdeutigkeiten der Sequenz wurden kurzere sich 

25 iiberlappende PCR-Fragmente der betreffenden Region amplifiziert und mehrere Klone sequenziert. Auf diese Weise 
konnten zahlreiche potentielle Mutationen in jedem Fragment identifiziert und somit eine isolat-spezifische Konsensus- 
sequenz etabliert werden. Diese etablierte Konsensussequenz bzw. dieses Genom gehort zum weltweit verbreiteten Ge- 
notyp lb. Die nicht translatierte Region am 3-Ende (= 3'NTR) wurde mittels konventioneller PGR erhalten, wobei ein 
Antisense- Primer eingesetzt wurde, der die letzten 24 Nukleotide des im Stand der Technik bekannten "X- tails" (Tanaka 

30 et al., 1995, Biochem. Biophys. Res. Commun. 215, 744; und Rice, PCT/US 96/14033) abdeckt. Die authentische nicht 
translatierte Region am 5'-Ende (= 5'NTR) strangabwarts vom T7 Promotor wurde mittels PGR erzeugt, wobei zum ei- 
nen ein Oligonukleotid verwendet wurde, das einem verkurzten T7 Promotor (TAA TAG GAG TCA CTA TAG) und den 
ersten 88 Nukleotiden von HGV entspricht, und zum anderen eines der vorgenannten Plasmide eingesetzt wurde, das ei- 
nes der 5'Fragmente des Genoms tragi. Aus den subgenomischen Fragmenten mit der geringsten Anzahl an Nicht-Kon- 

35 sensus-Austauschen wurde ein komplettes HCV-Konsensusgenom zusammengesetzt und in einen modifizierten 
pBR322- Vektor insertiert. Abweichungen von der Konsensussequenz wurden mittels ortsgerichteter Mutagenese ("site- 
directed mutagenesis") beseitigt. Um "run-ofF'-Transkripte mit einem authentischen 3'Ende herzustellen, wurde die 
3'NTR der Isolate (mit dem Ende TGT) zu AGT modifiziert (gemaB der Sequenz vom Genotyp 3 = Klon "WS" nach Ko- 
lykhalov et al., 1996, J. Virol. 70, 3363) und auBerdem wurde ein zusatzlicher Nukleotidaustausch an Position 9562 vor- 

40 genommen, um die A:T Basenpaarung in der Haamadelstruktur am 3'Ende der 3'NTR (Kolyhalov et al. ibid.) beizube- 
halten. Um eine interne Restriktionsstelle fur das Enzym Seal zu beseitigen, wurde ferner ein sog. stiller ("silent") Nu- 
kleotidaustausch vorgenommen. Nach dem Zusammenfugen des Vollangen-Genoms mit passenden 5'- und 3 r NTKen 
wurde die komplette HGV-Sequenz uberpruft. Dabei wurde kein ungewunschter Nukleotidaustausch gefunden. 
Das auf diese Weise hergestellte HGV-Genom sollte per Definition hepatotrop sein. 

45 

(B) Synthese selektierbarer HGV-Subgenorn-Konstrukte 

Unter Verwendung des unter (A) beschriebenen Konsensusgenoms wurden HGV-Subgenom-Konstrukte hergestellt, 
die das Antibiotikumresistenzgen Neomycin-Phosphotransferase (NPT) und zwei Sequenzen von internen Ribosomen- 

50 bindungsstellen (IRES) enthalten. Die hierfur angewendeten biochemischen Verfahren stechniken sind dem Fachmann 
bekannt und gelaufig (siehe: Sambrook, J., E. F. Fritsch, T. Maniatis, 1989, Molecularcloning: a laboratory manual, 2nd 
ed., Gold Spring Harbour Laboratory, Gold Spring Harbor, N. Y.; Ausubel et al. (eds.), 1994, Gurrent Protocols in Mole- 
cular Biology, Vol. 1-3, John Wiley & Sons Inc., New York). Das Antibiotikumresistenzgen wurde unmittelbar hinter der 
5 WYR insertiert, wodurch eine bicistronische RNA erhalten wurde (siehe Fig. 1 A). Ebensogut kann das Antibiotikum- 

55 resistenzgen aber auch an anderer S telle des HGV-Subgenom-Konstrukts insertiert werden, beispi els weise innerhalb der 
fur das Polyprotein kodierenden Nukleoudsequenz, wodurch eine monocistronische RNA erhalten wird (siehe Fig. 5A) 
oder in die 3'NTR (siehe Fig. 5B). Bei den IRES -Elemen ten handelt es sich zum einen um eine der beiden HGV-IRES- 
Varianten Nukleotide 1-377 oder Nukleotide 1-389, und zum anderen um die IRES des Enzephalomyocarditis Virus, die 
die Translation der HGV Sequenz strangabwarts von den Genen fur NS2 oder NS3 bis zu dem authentischen 3'Ende des 

60 Genoms steuert 

Die beiden genannten HGV-IRES-Varianten wurden wie folgt ermittelt: 
Auf der Basis von Deletionsanalysen der 3'Grenze der HGV-IRES (Reynolds et al. 1995, EMBO J. 14, 6010) wurden 
verschiedene Abschnitte der 5'NTR mit dem NPT Gen fusioniert und anhand von Kotransfektionen mit einem das T7 
RNA Polymerase Gen enthaltenden Plasmid hinsichtlich der maximalen Anzahl gebildeter Kolonien analysiert. Die be- 

65 sten Ergebnisse wurden mit den HGV Sequenzen von 1-377 und 1-389 erhalten. Da sich das AUG-Startkodon des HGV 
Polyproteins an Position 342 befindet und somit in der IRES-Sequenz enthalten ist, kommt es zu einer Fusion von 12 
bzw. 16 Aminosauren des HGV-Kapsidproteins ("Gore-Proteins") mit der Neomycin Phosphotransferase (siehe Fig. 1 A). 
Diese modifizierten HGV-Subgenom-Konstrukte erhielten dementsprechend die Bezeichnungen I 377 /NS2-3' (oder 
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I 3 77/NS3-3') .und I 389 /NS2-3' (oder l 3Z9 fNS3-3'). Sie sind in Fig. 1A schematise*! dargestellt. 

Mit in-vitro-Transkripten dieser modifizierten parentalen HCV-Subgenom-Konstrukte I 377 /NS2-3' (oder I389/NS3-3) 
und I389/NS2-3' (oder I 3 g9/NS3-3') wurden verschiedene Zeilinien und Primarzellkulturen von menschlichen Hepatocy- 
ten transfiziert. 

Als parallele Negativ-Kontrolle zu alien Transfektionsexperimenten wurde zu jedern modifizierten parentalen HCV- 5 
Subgenom-Konstrukt ein entsprechend modifiziertes aber defektes Subgenom konslruiert, das sich von dem parentalen 
dadurch unterscheidet, daB es innerhalb des Leserasters eine Deletion von 10 Aminosauren aufweist, die das aktive Zen- 
trum der NS5B RNA Polymerase umfaBl (Behrens et al., 1996, EMBO J. 15, 12; und Lohmann et al., 19977 Virol. 71, 
8416). 

10 

(C) Synthese selektierbarer HCV-Genom-Konstrukte 

Ein NS2-3'Subgenomkonstrukt, das am S'Ende mit einem Fragment des Luziferasegens und der vollstandigen EMCV- 
IRES verbunden ist, wurde mitNcol und Spel restringiert und mittels praparativer Agarosegelelektrophorese gereinigt. 
Der so erhaltene Vektor wurde in einer 3-Faktor Ligation mit einem NcoI/Notl-HCV-Fragment, entsprechend den Nu- 15 
kleotidpositionen 342 bis 1968 des HCV-Genoms und mit einem Notl/Spel-Fragment, entsprechend den Nukleotidposi- 
tionen 1968-9605 ligiert. Das entstandene Konstrukt, bei dem das vollstandige HCV-Leseraster und die 3'NTR stromab- 
warts dem Luziferasegenfragment und der EMCV-IRES liegen, wurde danach mit Pmel und Spel restringiert und mit 
dem analog restringierten I 389 /NS3-37wt-Subgenomkonstrukt-Vektor ligiert. Dieses selektionierbare HCV-Genomkon- 
strukt ist in Fig. 4 dargestellt. 20 

(D) Herstellung von den HCV-RNA-Konstrukten entsprechenden in-vitro-Transkripten 

Die vorstehend beschriebenen gereinigten Plasmid DNAs wurden mit Seal linearisiert und nach Phenol/Chloroform- 
Ex trakti on und Isopropanol-Prazipitation in eine In- vitro- Transkriptionsreaktion eingesetzt unter Verwendung der fol- 25 
genden Komponenten: 80 mM HEPES, pH 7,5, 12,5 mM MgQ 2 , 2 mM Spermidin, 40 mM Dithiothreitol, 2 mM von je- 
dern NTP, 1 Einheit RNasin/ul, 50 ug/ml restringierte DNA und ca. 2 Einheiten/ul T7 RNA Polymerase. Nach 2 Std. bei 
37°C wurde die Halfte der Menge an T7 Polymerase zugegeben und der Reaktionsansatz weitere 2 h inkubiert. Zur Ent- 
fernung von DNA wurde die Mischung mit saurem Phenol extrahiert (U. Kedzierski, J. C. Porte, 1991, Bio Techniques 
10, 210), mit Isopropanol prazipitiert, das Pellet in Wasser gelost und mit DNase (2 Einheiten pro ug DNA) fur 60 Min. 30 
bei 37°C inkubiert. Nach anschlieBender Extraktion mit saurem Phenol, saurem Phenol/Chloroform und Chloroform und 
Isopropanol-Prazipitation wurde die geloste RNA mittel optischer Dichtemessungen quantifiziert und ihre Unversehrt- 
heit mittels Formaldehyd-Agarose-Gelelektrophorese uberpriift. 

Beispiel 2 35 

Transfekuonsexperimente mit der Hepatomazellinie Huh- 7 

Bei samtlichen Transfektionsexperimenten wurde sorgfaltig darauf geachtet, daB jegliche Matrizen-DNA zuvor ent- 
fernt worden war, urn zu vermeiden, daB solche DNA in transfizierte Zellen integrieren und diesen unabhangig von einer 40 
HCV-Replikation eine Neornycin-Resistenz vermitteln konnte. Deshalb wurde im AnschluB an die in-vitro-Transkrip- 
tion (Beispiel ID) die Reaktionsmischung mit 2 Einheiten DNase pro ug DNA fur 60 Min. bei 37°C behandelt und mit 
saurem Phenol, saurem Phenol/Chloroform und Chloroform extrahiert. Vor der Verwendung fur die Transfektion wurde 
die prazipitierte RNA mittels Formaldehyd Agarose Gel Elektrophorese analysiert. 

Es wurden drei separate Transfektionsexperimente mit der hoch differenzierten humanen Hepatomazellinie Huh-7 45 
(gemaB Nakabayashi et al. 1982, Cancer Res. 42, 3858) durchgefuhrt. Dabei wurde jeweils 15 ug RNA in 8 x 10 6 Huh-7- 
Zellen mit Hilfe der Elektroporauon eingebracht und diese Zellen anschlieBend in Kulturschalen von 10 cm Durchmes- 
ser ausgesat. 24 Stunden nach der Aussaat wurde Neomycin (= G418) in einer Endkonzentration von 1 mg/ml zugege- 
ben. Das Kulturmedium wurde zweimal pro Woche gewechselt. Nach 3-5 Wochen waren kleine Kolonien erkennbar, die 
isohert und unter den gleichen Kulturbedingungen passagiert wurden. 50 

Die Zellklone, die im Verlauf des ersten Experiments erhalten wurden, wurden isoliert und subpassagiert. Wahrend 
dieser Prozedur starben die meisten Klone und die Endausbeute betrug nur noch 9 Klone von Zellen, die mit den paren- 
talen HCV-Subgenom-Konstrukten transfiziert worden waren und 1 Klon (Klone 8-1) von Zellen, die mit einem defekten 
HCV-Genom-Konstrukt, namlich einer defekten NS2-3'HCV-RNA transfiziert worden waren. AuBer einer verkurzten 
Verdopplungszeit und dem gelegentlichen Auftreten von irregular geformten Zellen wurden keine bestandigen morpho- 55 
logischen Unterschiede zwischen diesen 9 Zellklonen und dem einen Zellklon (Klon 8-1) oder den parentalen Huh-7 Zel- 
len gefunden. 

Die Hauptkriterien fur funktionierende HCV-Genomkonstrukte sind die Bildung von viraler RNA mit korrekter GroBe 
und die Abwesenheit von (integrierter) Plasmid DNA, die eine G418-Resistenz ubertragen bzw. vermitteln konnte. 

Urn die HCV-RNA in den Huh-7-Zellen zu bestimmen, wurde die Gesamt-RNA isoliert und mittels des gangigen 60 
Northern-Blot Verfahrens unter Verwendung einer Plusstrang-spezifischen Ribosonde (= RNA-Sonde) analysiert. Hier- 
fiir wurde von den jeweiligen Zellklonen Gesamt-RNA nach der Methode von Chomczynski und Sacchi 1987, Anal. 
Biochem. 162, 156 isoliert, und 10 ug RNA, was dem Gesamt-RNA-Gehalt von 0,5-1 x 10 6 Zellen entspricht, mittels de- 
naturierender Form aldehyd-Ag arose- Gelelektrophorese aufgetrennt (Spuren 3 bis 12 der Fig. IB). Als GroBenmarker 
mit authentischer Sequenz wurden gleichzeitig 109 in-vitro-Transkripte (ivtr.), die zu den I 389 /NS2-37wt oder den 65 
I 3 89/NS3-37wtReplikon-RNAs korrespondieren, mit aufgetrennt (Spur 1 bzw. Spur 2). Die aufgetrennte RNA wurde auf 
Nylon-Membranen transferiert und mit radioaktiv markierter Plusstrang-spezifischer RNA-Sonde, die komplementar zu 
dem kompletten NPT-Gen und der HCV-IRES von Nukleotid 377 bis Nukleotid 1 war, hybridisiert. Die Positionen der 
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HGV-spezifischen RNAs (Pfeile) und der 28S rRNA sind rechts von Spur 12 angegeben, die GroBen (Anzahlen der Nu- 
kleotide) der RNA-Marker sind links von Spur 1 angegeben. Die RNA Marker-Fragmente enthalten HCV-Sequenzen 
und hybridisieren deshalb mit der Ribosonde (= RNA-Sonde). Die Ergebnisse dieser Analyse sind in Fig* IB dargestellt. 
Mit Ausnahme des mit dem defekten HCV-Genom-Konstrukt transfizierien Klons 8-1, tieferten alle Zellklone homo- 

5 gene HCV-RNAs korrekter Lange (ca. 8640 Nukleotide im Fall des NS2-3' und ca. 7970 Nukleotide im Fall des NS3- 
.S'Replikons). Dieser Befund ist ein Indiz dafur, daB die funktionalen Replikons bzw. die funktionalen HGV-Genom-Kon- 
strukte die G418 Resistenz ubertragen. Urn auszuschlieBen, daB die G418 Resistenz auf eine Plasrnid-DNA zuriickzu- 
fuhren ist, die in das Genom der Huh-7 Wirtszelle integriert ist und unter der Kontrolle eines zellularen Promotors tran- 
skribiert wird, wurde von jedem Klon die DNA mittels einer NPT-Gen-speziflschen PGR untersucht. Hierbei wurde aus 

io den selektierten Huh-7-Zellklonen die DNA mittels Verdau mit Proteinase K (40ug/ml, 1 h, 37°G) in 10 mM Tris, 
pH 7,5, 1 mM EDTA, 0,5% SDS und anschlieBender Extraktion mit Phenol, Phenol/Ghloroform- und Isopropanolprazi- 
pitation isoliert. Das DNA-Prazipitat wurde in 10 mM Tris (pH 7,5) und 1 mM EDTA gelost und 1 Stunde mit Rnase A 
inkubiert. Im AnschluB an eine Phenol/Chloroform Extraktion und Ethanol Prazipitation wurde 1 ug DNA, entsprechend 
4-8 x 10 4 Zellen, mittels PGR unter Einsatz NPT-Gen-spezifischer Primer (5-TGAAGAGGGAGGTG TGGGGTGGGG- 

15 3' und 5'-GTTG AGGGTGGGG A AGAGTTGGGG- 3') analysiert und ein DNA-Fragment bestehend aus 379 Nukleotiden 
erzeugt. Die Spezifitat des PGR-Produkts wurde mittels Southern Blot Verfahren nachgewiesen, wobei ein Digoxigenin- 
markiertes DNA Fragment eingesetzt wurde, das zu dem NPT-Gen korrespondiert. Als Positiv-Kontroilen (zum Nach- 
weis etwa vorhandener kontaminierender Nukleinsauren) wurde das PGR- Verfahren mit 10 7 Plasrnid Molekulen oder 
1 ug DNA aus einer BHK Zellinie, die stabil mit einem Neomycin-Resistenz-Gen transfiziert war, durchgefuhrt, und als 

20 Negativ- Kontrolle wurde die PGR mit denselben Reagenzien aber ohne zugesetzte DNA durchgefuhrt. 

Die Ergebnisse dieser Untersuchung sind in Fig. 1G dargestellt. Die Spuren 1 und 2 reprasentieren die Positiv-Kon- 
trollen, Spur 13 reprasentiert die Negativ-Kontrolle. Die Zahlenangaben links der Spur 1 bezeichnen die GroBe der Nu- 
kleotid-Marker-Molekule. AuBer in Klon 7-3 (Fig. 1G, Spur 3), der von Zellen nach Transfektion mit einem NS2-3'-Re- 
plikon/NS2-3 r HGV-Genom-Konstrukt stammt, und in Klon 8-1 (Fig. 1G, Spur 12), der von Zellen nach Transfektion mit 

25 einem defekten HGV-Genom-Konstrukt stammt, war in keinem Zellklon eine NPT-DNA nachweisbar. Dieser Befund ist 
ein weiteres Indiz dafur, daB die G418 Resistenz der meisten Klone durch die replizierende HGV-RNA vermittelt wurde. 
Aber auch unabhangig von diesen Ergebnissen ist es unwahrscheinlich, daB HGV-RNAs mit korrekter GroBe von inte- 
grierter Plasmid DNA erzeugt wird, denn die fur die in-vitro-Transkription verwendeten Plasmide enthalten weder einen 
eukaryontischen Promotor noch ein Polyadenylierungssignal. Im Fall des Klons 7-3 ist die Resistenz deshalb hochst 

30 wahrscheinlich sowohl durch das HGV-RNA -Konstrukt bzw. die repii zierende HGV-RNA als auch durch eine integrierte 
NPT-DNA Sequenz vermittelt worden, wahrend die Resistenz der Zellen von Klon 8-1 ausschlieBlich auf die integrierte 
Plasmid DNA zuruckzufuhren ist. 

Urn zu bestatigen, daB die G418 Resistenz von einer autonom replizierenden HGV-RNA vermittelt ist, wurde der Klon 
9-13 (Fig. IB, Spur 11) weiteren Tests unterworfen. Klon 8-1, der integrierte Kopien des NPT-Gens tragt, wurde uberall 

35 als Negativkontrolle eingesetzt. Mit dem Ziel, die Anwesenheit von NPT-DNA im Klon 9-13 rigoros auszuschlieBen, 
wurde eine PGR durchgefuhrt, die den Nachweis von < 1000 NPT-Gen-Kopien in 40.000 Zellen erlaubt. Das Ergebnis 
dieser PGR ist in Fig. 2A dargestellt. Im einzelnen wurde bei dieser PGR wie folgt verfahren: 

Es wurden jeweils lOMO^Plasmid Molekiile (I 377 /NS3-37wt) entweder direkt (Spuren 7-11) oder nach Zugabe von 
jeweils 1 ug 9-13 DNA (Spuren 2-6) in dem Test eingesetzt. Die Spezifitat der amplifizierten DNA Fragment wurde mit- 

40 tels Southern Blot unter Verwendung einer NPT-spezifischen Sonde bestimmt. Eine PGR ohne DNA-Sonde wurde als 
Negativ-Kontrolle durchgefuhrt (Spur 12). 

Selbst mit dieser sensitiven Methode wurde in einem ug DNA des Zellklons 9-13 keine Plasmid DNA gefunden (Spur 
1). Um die Menge an HGV Plus- und Minusstrang RNAs in diesen Zellen abzuschatzen, wurde eine Verdunnungsreihe 
von Gesamt-RNA mit dem Northern-Blot- Verfahren unter Verwendung einer Plus- oder Minusstrang-spezifischen radio- 

45 akti v markierten Ribosonde (= RNA-Sonde) analysiert. Hierfur wurden jeweils 8, 4 oder 2 ug Gesamt-RNA, die aus den 
Zellklonen 9-13 und 8-1 isoliert worden waren, parallel zu bekannten Mengen analoger in-vitro-Transkripte mit Plus- 
oder Minusstrang-Polaritat (Kontroll-RNAs) im Northern-Blot- Verfahren analysiert und anschlieBend einer Hybridisie- 
rung unterworfen. Die Hybridisierung wurde mit einer Plusstrang-spezifischen Ribosonde, die das komplette NPT-Gen 
und die HGV-IRES abdeckte ("plusstrand", obere Bildtafel), oder mit einer Minusstrang-spezifischen RNA-Sonde, die 

50 zu der NS3-Sequenz komplementar war ("minusstrand", untere Bildtafel) durchgefuhrt. Die Pfeile markieren die Posi- 
tionen von Replikon-RNA. Die Ergebnisse dieser Analyse sind in Fig. 2B dargestellt. 

Im Fall des Plusstrangs wurden ca. 10 8 Kopien/ug Gesamt-RNA nachgewiesen, was 1000-5000 HGV-RNA-Molekii- 
len pro Zelle entspricht, wahrend die Menge an Minusstrang-RNA 5- bis 10-fach niedriger war. Dieses Ergebnis stimmt 
mit der Annahme uberein, daB die Minusstrang RNA die replikative Zwischenform bzw. Zwischenkopie ist, die als Vor- 

55 lage fur die Syn these der Plusstrang Molekiile dient. 

Da die Reaktion im wesentlichen von der viralen RNA-abhangigen RNA Polymerase katalysiert wird, sollte die Syn- 
these der HGV-RNAs resistent gegen Dactinornycin sein, einem Antibiotikum, das selektiv die RNA-Synthese von 
DNA-Matrizen inhibiert, nicht jedoch die RNA-Synthese von RNA-Matrizen. Um diese Vermutung zu bestatigen, wur- 
den Zellen mit [ 3 H] Uridin in Anwesenheit von Dactinornycin inkubiert, die radioaktiv markierten RNAs extrahiert, mit- 

60 tels denaturierender Agarose-Gel-Eleku*ophorese aufgetrennt und mit Hilfe eines handelsublichen Bio-Imagers unter 
Verwendung einer [ 3 H] -sensitiven BildplaUe analysiert. Hierfur wurden jeweils ca. 5 x 10 5 Zellen der Klone 9-13 und 8- 
1 mit 100 u Gi [ 3 H]Uridin fiir 16 Std. in Abwesenheit (-) oder Gegenwart (+) von 4 ug/ml Dactinornycin (Dact) inku- 
biert. Im AnschluB an diese Markierungsreaktion wurde die Gesamt-RNA prapariert und mittels Formaldehyd-Agarose- 
Gel-Elektrophorese analysiert. In den beiden ersten Spuren ist nur 1/10 der Gesamt-RNA dargestellt. Die radioaktiv mar- 

65 kierte RNA wurden mit einem BAS-2500 Bio-Imager (Firma Fuji) sichtbar gemacht. 

Die Ergebnisse dieser Analyse sind in Fig. 2G dargestellt. In Ubereinstimmung mit dem Inhibitor-Profii der NS5B Po- 
lymerase (Behrens et al., 1996, EMBOJ. 15, 12 und Lohmann et aL, 1997, J. Virol. 71, 8416) war die Replikation der 
HGV-RNA nicht durch Dactinornycin beeinfluBt worden, wahrend die Synthese von zellularer RNA gehemmt worden 
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war. Um die Idenutat der viralen RNA zu bestatigen, wurde eine RT-PCR zur Reklonierung der replizierten Sequenzen 
durchgefuhrt. Die Sequenzanalyse der reklonierten RNA zeigte, daB die RNA in dem Klon 9-13 HCV-spezifisch ist und 
mit dem transfizierten Transkript des HCV-Konstrukts I 3 77/NS3-3ywt ubereinstimmt. 

Zur Analyse der viralen Proteine wurden die betreffenden Zellen zunachst metabolisch mit [ 35 S] Methionin/Cystein 
radioaktiv markiert, anschlieBend lysiert und danach die HCV-spezifischen Proteine mittels Immunoprazipitation aus 5 
den Zell-Lysaten isolierl. Die Ergebnisse dieser Analysen sind in Fig. 3 A dargestellt. Im einzelnen wurde dabei wie folgt 
verfahren: Zellen der Zellklone 9-1 3 (wt) und 8-1 ( A ) waren durch Behandlung fur 1 6 Stunden mit einer dem Fachmann 
gelaufigen und im Handel erhaltlichen Protein-Markierungs-Mischung (z. B. NEN Life Science) metabolisch radioaktiv 
markiert worden. Mittels Immunoprazipitation (IP) unter nichtdenaturierenden Bedingungen (z. B. nach Bartenschlager 
et aL, 1995,.l Virol. 69, 751 9) und unter Verwendung von drei verschiedenen Antiseren (3/4, 5 A, 5B, gemaB Markierung 10 
am oberen Ende der Spuren 1 bis 12) waren die HCV-spezifischen Proteine vom Zell-Lysat abgetrennt worden. Die Im- 
munokomplexe wurden mittels Tricine SDS-PAGE analysiert und mittels Autoradiographic sichtbar gemacht. Um au- 
thentische GroBenmarker zu erhalten, wurde das homologe Replikonkonstrukt I 377 /NS3-37wt einer transienten Expres- 
sion mit dem Vaccinia Virus T7- Hybrid System in Huh-7 Zellen unterworfen. Die dabei erhaltenen Produkte waren als 
GroBenmarker (Spuren 7-9) parallel zu den Zellen der Klone 9-13 und 8-1 behandelt worden. Identifizierte HCV-Pro- 15 
teine sind am linken Rand von Spur 1 markiert, dieMolekulargewichte (in Kilodalton) sind am rechten Rand von Spur 9 
angegeben. Es ist anzumerken, daB das verwendeteNS3/4-spezifische Antiserum ("3/4") bevorzugt mit NS4A und NS4B 
reagiert, was zu einer Unterreprasentation von NS3 fuhrt. 

Alle viralen Antigene waren eindeutig nachweisbar und ihre apparenten Molekulargewichte zeigten keine Abwei- 
chungen gegen iiber denjenigen, die nach transienter Expression desselben bicistronischen HCV-RNA-Konstrukts in den 20 
urspriinglichen Huh-7 Zellen ermittelt wurden. Um die subzellulare Verteilung der viralen Antigene zu bestimrnen, 
wurde eine Immunofluoreszenz-Nachweisreaktion unter Einsatz von NS3- und NS5A-spezifischen Antiseren durchge- 
fuhrt (z. B. nach Bartenschlager et aL, 1995, J. Virol. 69, 7519). Hierfur wurden Zellen der Klone 9-13 (wt) und 8-1 (A) 
24 Std. nach dem Aussaen auf Deckglasern mit Methanol/Azeton fixiert und mit polyklonalen NS3- oder NS5A-spezifi- 
schen Antiseren inkubiert. Die gebundenen Antikorper wurden mit einem kommerziell erhaltlichen FTI C-konj ugierten 25 
Anti-Kaninchen-Antiserum sichtbar gemacht. Zur Unterdruckung unspezifischer Ruoreszenzsignale wurden die Zellen 
mit dem Farbstoff "Evans Blue" gegengefarbt. 

Die Ergebnisse dieses Nachweistests sind in Fig. 3 B dargestellt. Mit beiden Antiseren war eine starke Fluoreszenz im 
Zytoplasma nachweisbar. Die NS5A-spezifischen Antiseren fuhrten auBerdem zu einer schwachen Zellkern-Fluores- 
zenz, was darauf hindeutet, daB zumindest kleine Mengen dieses Antigens auch zum Zellkern gelangen. Die generell do- 30 
minierende Prasenz der viralen Antigene im Zytoplasma ist jedoch ein starkes Indiz dafur, daB die HCV-RNA Replika- 
tion im Zytoplasma stattfindet - so wie das bei den meisten RNA-Viren der Fall ist, 

Diese Ergebnisse belegen klar, daB mit dem hier beschriebenen Versuchsansatz der Aufbau eines Zellkultursystems 
fur das HCV gelungen ist, dessen Effizienz alles bisher bekannte um GroBenordnungen iibersteigt und erstmalig den 
Nachweis viraler Nukleinsauren und Proteine mit konventionellen und bewahrten biochemischen Methoden erlaubt. Erst 35 
diese Effizienz erlaubt uberhaupt detaillierte Untersuchungen der HCVPathogenese, genetische Analysen verschiedener 
HCV-Funktionen und ein genaues Studium der Virus-/Wirtszellwechselwirkungen, wodurch sich neue Ansatzpunkte fur 
die Entwicklung einer antiviralen Therapie definieren lassen. 

Beispiel 3 40 

Transfektion von Huh-7 Zellen mit HCV-Genomkonstrukten 

Huh-7 Zellen werden wie in Beispiel 2 beschrieben transfiziert und selektioniert, wobei hier jedoch selektionierbare 
Konstrukte verwendet werden, die das vollstandige Virusgenom enthalten. Die erhaltenen Zellklone werden analog dem 45 
Beispiel 2 mittels PCR auf Abwesenheit von HCV-DNA untersucht und die produktive Replikation der HCV-RNA wird 
danach mittels Northern Blot, [ 3 H]Uridinmarkiening in Anwesenheit von Dactinomycin, Nachweis der viralen Proteine 
bzw. Antigene vorzugsweise mit Hilfe des Western Blots, der Immunoprazipitation oder der Immunfluoreszenz nachge- 
wiesen. Im Gegensatz zu den im Beispiel 2 beschriebenen Ansatzen lassen sich mit dem hier beschriebenen Konstrukt 
auBerdem vollstandige und sehr wahrscheinlich infektiose Viren erhalten, was bei den dort (in Beispiel 2) beschriebenen 50 
Subgenomkonstrukten nicht der Fall ist. Diese Viren, die in der Zelle und dem Zellkulturuberstand vorhanden sind, wer- 
den beispielsweise mittels Ultrazentrifugation, Immunprazipitation oder Fallung mit Polyethylenglykol konzentriert und 
alle exogenen, d. h. nicht im Viruspartikel eingebauten Nukleinsauren werden mittels Inkubation mit Nukleasen (RNase, 
DNase, Mikrococusnuklease) verdaut. Auf diese Weise lassen sich alle kontaminierenden Nukleinsauren, die nicht im 
schiitzenden Virusparukel enthalten sind, entfemen. Die geschiitzte virale RNA wird nach Inaktivierung der Nukleasen, 55 
beispielsweise mittels Inkubation mit Proteinase K in einem SDS-haltigen Puffer durch Extraktion mit Phenol und Phe- 
nol/Chloroform isoliert und mittels Northern Blot oder RT-PCR unter Verwendung HCV-spezifischer Primer nachgewie- 
sen. Auch in diesem Versuchsansatz ist die Kombination des beschriebenen HCV-Konsensusgenoms mit einem Selekti- 
onsmarker entscheidend fur die effiziente Produktion von viraler RNA, viralem Protein und damit von HCV-Partikeln. 

60 

Beispiel 4 

Herstellung und Anwendung eines HCV-RNA Konstrukts, bei dem das Resistenzgen iiber ein Ribozym bzw. eine Erken- 
nungsstelle fur ein Ribozym mit der HCVSubgenom-Sequenz verbunden ist 

65 

Es wird ein HCV-RNA-Konstrukt gemaB Beispiel 1 oder Beispiel 3 hergestellt, bei dem ein Antibiotikumresistenzgen 
iiber ein Ribozym bzw. eine Erkennungsstelle fiir ein Ribozym mit der HCVRNA-Sequenz verbunden ist. Solche Kon- 
strukte sind in Fig, 7 schematisch dargestellt. Huh-7 Zellen werden wie in Beispiel 2 beschrieben mit diesem HCV-RNA- 
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Konstrukt transfiziert. Nach der Transfektion in die Zellen erfolgt zunachst die Selektion mit dem entsprechenden Anti- 
biotikum. In den dabei erhahenen Zeliklonen wird das einklonierte Ribozym aktivierl oder, im Fall eines Konstrukts, das 
eine Erkennungsstelle fiir ein Ribozym tragi, wird das Ribozyrn in die Zelle eingeschleust (z. B. mittels Transfektion ei- 
nes Ribozymkonstrukts oder Infektion mit einem viralen Expressionsveklor, in den das entsprechende Ribozym einge- 
5 setzt wurde). In beiden Fallen wird durch die ribozymvermittelte Spaltung das Resistenzgen von der HCV-RNA-Sequenz 
abgetrennt. Das Ergebnis ist im Fall des HCV-Genom- Konstrukts ein authentisches HCV-Genom ohne Resistenzgen, das 
zur Bildung authentischer infektidser Viruspartikel befahigt ist. Im Fall des HCV-Subgenom-Konstrukts entsteht ein 
HCV-Replikon ohne Resistenzgen. 

10 Beispiel 5 

Kotransfektion eines HCV-RNA-Konstrukts mit einem separaten Luziferase-Transfektionskonstrukt 

Es wird ein HCV-RNA-Konstrukt gemaB Beispiel 1(A) oder Beispiel 3 oder Beispiel 4 hergestellt. Parallel dazu wird 

15 ein Transfektionskonstrukt hergestellt, welches das Luziferasegen umfaBt, wobei dieses Luziferasegen vermittels einer 
ersten Nukleotidsequenz, die fur eine HCV-Protease- (z. B. NS3-Protease-)Spaltungss telle kodiert, mit einer zweiten 
Nukleotidsequenz, die fur ein anderes Protein oder einen Teil eines anderen Proteins kodiert, verbunden ist. HCV-RNA- 
Konstrukt und Transfektionskonstrukt werden in beliebige Wirtszellen, vorzugsweise Hepatomazellen, insbesondere 
Huh-7-Zellen, eingeschleust. Dies kann auf die in Beispiel 2 beschriebene Art und Weise geschehen. Das Produkt des 

20 modifizierten Luziferasegens ist ein Luziferase-Fusionsprotein, in dem die Luziferase auf Grund der Fusion mit dem 
Fremdanteil inaktiv ist In transfizierten Zellen mit hoher HCV-Replikation wird das Fusionsprotein, das ja eine Schnitt- 
stelle fur eine HCV-Protease enthalt, gespalten und damit die aktive Form der Luziferase freigesetzt, die sich durch lu- 
minometrische Messung bestimmen laBt. Wird die Replikation des HCV-RNA-Konstrukts gehemmt, wird das Fusions- 
protein nicht gespalten und keine aktive Luziferase freigesetzt. Infolgedessen ist die quantitative Bestimmung der Luzi- 

25 ferase ein MaB fur die Replikation des HCV-Subgenom-Konstrukts. Anstelle des Luziferasegens kann ebensogut ein an- 
deres Reportergen verwendet werden, das in analoger Weise modifiziert ist, so daB seine Expression von der Virusrepli- 
kation abhangt, obwohl dieses Reportergen nicht Bestandteil des HCV-Subgenom-Konstrukts ist. Es kann auch ein zel- 
lulares Protein, welches durch die HCV-Proteine oder Nukleinsaure inaktiviert oder aktivierl wird, als sogenannter Sur- 
rogatmarker verwendet werden. In diesem Fall ist die Expression bzw. Aktivitat dieses Surrogatmarkers ein MaB fur die 

30 Replikation der viralen DNA. 

Beispiel 6 

Herstellung von HCV-Subgenom-Konstrukten mit integrierten Fremdgenen zur Verwendung als leberzellspezifische 
35 Genfahren fiir die Gentherapie 

Diese rekombinanten und selektionierbaren HCV-Subgenom-Konstrukte werden in trans-komplementierende Helfer- 
zellinien transfiziert, d. h. in Zellinien, die induzierbar oder konstitutiv die fehlenden Funktionen (beispielsweise die 
Strukturproteine) exprimieren. Zellklone, die ein funktionelles HCV-Subgenom- Konstrukt enthalten, lassen sich durch 

40 entsprechende Selektion etablieren. Die von der Wirtszelle exprimierten Virus- Strukturproteine erlauben die Bildung 
von Viruspartikeln, in die die RNA der HCV-Subgenom-Konstrukte eingeschleust wird. Das Ergebnis sind also virus- 
ahnliche Partikel, die ein erfindungsgemaBes HCV-Subgenom-Konstrukt einschlieBlich des einklonierten Fremdgens 
enthalten und die dieses mittels Infektion auf andere Zellen ubertragen konnen. Ein Beispiel fur ein solches Konstrukt ist 
in Fig. 8 dargestellt. Es besteht auch die Moglichkeit, das hier beschriebene erfindungsgemaBe HCV-Subgenom-Kon- 

45 strukt mit integriertem Fremdgen direkt als Expressions vektor einzusetzen. Dabei wird analog dem vorgenannten Ver- 
fahren vorgegangen, allerdings mit dem Unterschied, daB Zellinien transfiziert werden, die keine transkomplementieren- 
den Faktoren exprimieren. In diesem Fall dient das HCV-Konstrukt also lediglich als Expressionsveklor. 
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SEQUENZPROTOKOLL 

ALLGEMEINE ANGABEN: 

ANMELDER: 

NAME: Universitat Mainz 
STRASSE: Obere Zahlbacher Str. 67. .. 
ORT: Mainz 

BUNDESLAND: Rheinland-Pfalz 
LAND: Deutschland 
PO STLEITZ AHL: 55101 

VERTRETER: 

NAME: Dr. Ulrike Rudolph 
STRASSE: In der Schanz 10 
ORT: Schriesheim 

BUNDESLAND: Baden- Wurttetnberg 
LAND: Deutschland 
PO STLEITZ AHL: 69198 
VERTRETERNUMMER: 246 263 
AKTENZEICHEN: 



TELEKOMMUNIKATION: 

TELEFON: 06203-61348 
TELEFAX: 06203-64196 



BEZEICHNUNG DER ERFINDUNG: 

Hepatitis C Virus Zellkultursystem 



ANZAHL DER SEQUENZEN: 5 



COMPUTERLESBARE FASSUNG: 

DATENTRAGER: Diskette 
COMPUTER: PC 
BETRIEBSSYSTEM. MS DOS 
SOFTWARE: Word 6.0 fur windows 95 



13 



DE 199 15 178 A 1 



ANGABEN ZU SEQ ID-NO: 1 : 

SEQUENZCHARAKTERISTIKA: 
5 LANGE: 1 1 076 Basenpaare 

ART: Nukleinsaure 

STRANGFORM: Einzelstrang 
10 TOPOLOGIE: linear 

ART DES MOLEKULS: Genom-RNA 

is HYPOTHETISCH: Nein 

ANTI-SENSE: nein 

20 URSPRUNGLICHE HERKUNFT: 

ORGANISMUS: Hepatitis C Virus 
STAMM: Genotyp lb 
ENTWICKLUNGS STADIUM: — 
ZELLTYP: — 

UNMITTELB ARE HERKUNFT: 
30 Isolat aus humanen Leberzellen 

MERKMAL: 

NAME/SCHLUSSEL: kodierende Sequenz fur Viruspartikel 
35 LAGE: — 

ERMITTLUNGSMETHODE: . experimentell 



40 



SEQUENZBESCHREIBUNG: SEQ ID-NO. 1 
I 38 9/Core-3 • /wt : 11076 bp 



50 


GCCAGCCCCC 


GATTGGGGGC 


GACACTCCAC 


CATAGATCAC 


TCCCCTGTGA 


50 


GGAACTACTG 


TCTTCACGCA 


GAAAGCGTCT 


AGCCATGGCG 


TTAGTATGAG 


100 




TGTCGTGCAG 


CCTCCAGGAC 


CCCCCCTCCC 


GGGAGAGCCA 


TAGTGGTCTG 


150 


55 


CGGAACCGGT 


GAGTACACCG 


GAATTGCCAG 


GACGACCGGG 


TCCTTTCTTG 


200 




GATCAACCCG 


CTCAATGCCT 


GGAGATTTGG 


GCGTGCCCCC 


GCGAGACTGC 


250 


60 


TAGCCGAGTA 


GTGTTGGGTC 


GCGAAAGGCC 


TTGTGGTACT 


GCCTGATAGG 


300 




GTGCTTGCGA 


GTGCCCCGGG 


AGGTCTCGTA 


GACCGTGCAC 


CATGAGCACG 


350 


65 


AATCCTAAAC 


CTCAAAGAAA 


AACCAAACGT 


AACACCAACG 


GGCGCGCCAT 


400 




GATTGAACAA 


GATGGATTGC 


ACGCAGGTTC 


TCCGGCCGCT 


TGGGTGGAGA 


450 
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GGCTATTCGG 
GCCGTGTTCC 
CGACCTGTCC 
CGTGGCTGGC 
ACTGAAGCGG 
TCTCCTGTCA 
ATGCAATGCG 
CACCAAGCGA 
TCTTGTCGAT 
CCGAACTGTT 
GTCGTGACCC 
CCGCTTTTCT 
ATCAGGACAT 
GAATGGGCTG 
GCAGCGCATC 
CAGACCACAA 
CCCCCCCCCT 
CGTTTGTCTA 
AGGGCCCGGA 
TTCCCCTCTC 
CAGTTCCTCT 
TGCAGGCAGC 
GCCACGTGTA 
TTGTGAGTTG 
TTCAACAAGG 
TGATCTGGGG 
AAAACGTCTA 
CACGATAATA 
TAACACCAAC 
TCGTCGGTGG 
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CTATGACTGG GCACAACAGA CAATCGGCTG CTCTGATGCC 500 

GGCTGTCAGC GCAGGGGCGC CCGGTTCTTT TTGTCAAGAC 550 

GGTGCCCTGA ATGAACTGCA GGACGAGGCA GCGCGGCTAT '600 

C AC GACGGGC GTTCCTTGCG CAGCTGTGCT CGACGTTGTC 650 

GAAGGGACTG GCTGCTATTG GGCGAAGTGC CGGGGCAGGA 700 

TCTCACCTTG CTCCTGCCGA GAAAGTATCC ATCATGGCTG 750 

GCGGCTGCAT ACGCTTGATC CGGCTACCTG CCCATTCGAC 800 

AAC AT CGC AT CGAGCGAGCA CGTACTCGGA TGGAAGCCGG 850 

CAGGATG AT C TGGACGAAGA GCATCAGGGG CTCGCGCCAG 900 

CGCCAGGCTC AAGGCGCGCA TGCCCGACGG CGAGGATCTC 950 

ATGGCGATGC CTGCTTGCCG AATATCATGG TGGAAAATGG 1000 

GGATTCATCG ACTGTGGCCG GCTGGGTGTG GCGGACCGCT 1050 

AGCGTTGGCT ACCCGTGATA TTGCTGAAGA GCTTGGCGGC 1100 

ACCGCTTCCT CGTGCTTTAC GGTATCGCCG CTCCCGATTC 1150 

GCCTTCTATC GCCTTCTTGA CGAGTTCTTC TGAGTTTAAA 1200 

CGGTTTCCCT CTAGCGGGAT CAATTCCGCC CCTCTCCCTC 1250 

AACGTTACTG GCCGAAGCCG CTTGGAATAA GGCCGGTGTG 1300 

TATGTTATTT TCCACCATAT TGCCGTCTTT TGGCAATGTG 1350 

AACCTGGCCC TGTCTTCTTG ACGAGCATTC CTAGGGGTCT 1400 

GCCAAAGGAA TGCAAGGTCT GTTGAATGTC GTGAAGGAAG 1450 

GGAAGCTTCT TGAAGACAAA CAACGTCTGT AGCGACCCTT 1500 

GGAACCCCCC ACC TGGCGAC AGGTGCCTCT GCGGC C AAAA 1550 

TAAGATACAC CTGCAAAGGC GGCACAACCC CAGTGCCACG 1600 

GATAGTTGTG GAAAGAGTCA AATGGCTCTC CTCAAGCGTA 1650 

GGCTGAAGGA TGCCCAGAAG GTACCCCATT GTATGGGATC 1700 

CCTCGGTGCA CATGCTTTAC ATGTGTTTAG TCGAGGTTAA 1750 

GGCCCCCCGA ACCACGGGGA CGTGGTTTTC CTTTGAAAAA 1800 

CCATGGGCAC GAATCCTAAA CCTCAAAGAA AAACCAAACG 1850 

CGCCGCCCAC AGGACGTCAA GTTCCCGGGC GGTGGTCAGA 1900 

AGTTTACCTG TTGCCGCGCA GGGGCCCCAG GTTGGGTGTG 1950 
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CGCGCGACTA GGAAGACTTC CGAGCGGTCG 
ACCTATCCCC AAGGCTCGCC AGCCCGAGGG 

5 

GGTACCCCTG GCCCCTCTAT GGCAATGAGG 
CTCCTGTCAC CCCGTGGCTC TCGGCCTAGT 

10 GCGTAGGTCG CGCAATTTGG GTAAGGTCAT 
TCGCCGATCT CATGGGGTAC ATTCCGCTCG 

15 GCTGCCAGGG CCCTGGCGCA TGGCGTCCGG 
CTATGCAACA GGGAATCTGC CCGGTTGCTC 
CTTTGCTGTC CTGTTTGACC ATCCCAGCTT 

20 

GTATCCGGAG TGTACCATGT CACGAACGAC 
GTATGAGGCA GCGGACATGA TCATGCATAC 

25 

TTCGGGAGAA CAACTCCTCC CGCTGCTGGG 
GCGGCCAGGA ACGCTAGCGT CCCCACTACG 

30 TTTGCTCGTT GGGGCGGCTG CTCTCTGCTC 
TCTGCGGATC TGTTTTCCTC GTCGCCCAGC 

35 CGGCACGAGA CAGTACAGGA CTGCAATTGC 
GACAGGTCAC CGTATGGCTT GGGATATGAT 
CAGCCCTAGT GGTATCGCAG TTACTCCGGA 

40 

ATGGTGGCGG GGGCCCATTG GGGAGTCCTA 
CATGGTGGGG AACTGGGCTA AGGTTCTGAT 

45 

GCGTTGACGG GGGAACCTAT GTGACAGGGG 
CTCGGGATTA CGTCCCTCTT TTCACCCGGG 

50 TGTAAACACC AACGGCAGCT GGCACATCAA 
ATGACTCCCT CAACACTGGG TTCCTTGCTG 

55 TTCAACTCAT CTGGATGCCC AGAGCGCATG 
CGCGTTCGCT CAGGGGTGGG GGCCCATCAC 
CGGACCAGAG GCCTTATTGT T GGC ACT ACG 

60 

GTACCCGCGG CGCAGGTGTG TGGTCCAGTG 
TGTCGTGGTG GGGACGACCG ACCGGTTCGG 
65 GGGAGAATGA GACGGACGTG CTGCTTCTTA 



CAACCTCGTG GAAGGCGACA 2000 

TAGGGCCTGG GCTCAGCCCG 2050 

GCTTGGGGTG GGCAGGATGG 2100 

TGGGGC CC C A CGGACCCCCG 2150 

CGATACCCTC ACGTGCGGCT 2200 

TCGGCGCCCC CCTAGGGGGC 2250 

GTTCTGGAGG ACGGCGT GAA 2300 

CTTTTCTATC TTCCTTTTGG 2350 

CCGCTTATGA AGTGCGCAAC 2400 

TGC TCCAACG CAAGCATTGT 2450 

CCCCGGGTGC GTGCCCTGCG 2500 

TAGCGCTCAC TCCCACGCTC 2550 

ACGATACGAC GCCATGTCGA 2600 

CGCTATGTAC GTGGGAGATC 2650 

TGTTCACCTT CTCGCCTCGC 2700 

TCAATATATC CCGGCCACGT 2750 

GATGAACTGG TCACCTACAG 2800 

TCCCACAAGC TGTCGTGGAT 2850 

GCGGGCCTTG CCTACTATTC 2900 

TGTGATGCTA CTCTTTGCCG 2950 

GG ACG AT GGC CAAAAACACC 3000 

TCATCCCAGA AAATCCAGCT 3050 

CAGGACTGCC CTGAACTGCA 3100 

CGCTGTTCTA CGTGCACAAG 3150 

GCCAGCTGCA GCCCCATCGA 3200 

TTACAATGAG TCACACAGCT 3250 

CACCCCGGCC GTGCGGTATC 3300 

TACTGCTTCA CCCCAAGCCC 3350 

CGTCCCTACG TACAGTTGGG 3400 

ACAACACGCG GCCGCCGCAA 3450 
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GGCAACTGGT 
GTGCGGGGGC 
CCTGCCCCAC 
TGTGGTTCGG 
CAGGCTTTGG 
GGATGTACGT 
ACTCGAGGAG 
CCCGCTGCTG 
CCACCCTACC 
GTGGACGTAC 
AATCAAATGG 
GCGTCTGTGC 
GCCCTAGAGA 
TGGCATTCTC 
GCAGGCTGGT 
CTCCTGCTCC 
GATGGCAGCA 
CCTTGTCACC 
CAATATTTTA 
CCTCAACGTT 
TCCACCCAGA 
GGTCCACTCA 
GCGCGCACAC 
GGGGTCATTA 
ACGTACGTTT 
CCTACGAGAC 
AGACCAAGGT 
ATCTTGGGCC 
ACCGGCAGAC 
CGGCCTACTC 
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TTGGCTGTAC ATGGATGAAT AGCACTGGGT TCACCAAGAC 3500 

CCCCCGTGTA ACATCGGGGG GATCGGCAAT AAAACCTTGA 3550 

GGACTGCTTC CGGAAGCACC CCGAGGCCAC TTACACCAAG 3600 

GGCCTTGGTT GACACCCAGA TGCTTGGTCC ACTACCCATA 3650 

CACTACCCCT GCACTGTCAA CTTTACCATC TTCAAGGTTA 3700 

GGGGGGAGTG GAGCACAGGC TCGAAGCCGC ATGCAATTGG 3750 

AGCGTTGTAA CCTGGAGGAC AGGGACAGAT CAGAGCTTAG 3800 

CTGTCTACAA CGGAGTGGCA GGTATTGCCC TGTTCCTTCA 3850 

GGCTCTGTCC ACTGGTTTGA TCCATCTCCA TCAGAACGTC 3 900 

AATACCTGTA CGGTATAGGG TCGGCGGTTG TCTCCTTTGC 3950 

GAGTATGTCC TGTTGCTCTT CCTTCTTCTG GCGGAC GCGC 4000 

CTGCTTGTGG ATGATGCTGC TGATAGCTCA AGCTGAGGCC 4 050 

ACCTGGTGGT CCTCAACGCG GCATCCGTGG CCGGGGCGCA 4100 

TCCTTCCTCG TGTTCTTCTG TGCTGCCTGG TACATCAAGG 4150 

CCCTGGGGCG GCATATGCCC TCTACGGCGT ATGGCCGCTA 4200 

TGCTGGCGTT ACCACCACGA GCATACGCCA TGGACCGGGA 4 250 

TCGTGCGGAG GCGCGGTTTT CGTAGGTCTG ATACTCTTGA 4 300 

GCACTATAAG CTGTTCCTCG CTAGGCTCAT ATGGTGGTTA 4350 

TCACCAGGGC CGAGGCACAC TTGCAAGTGT GGATCCCCCC 4 4 00 

CGGGGGGGCC GCGATGCCGT CATCCTCCTC ACGTGCGCGA 4450 

GCTAATCTTT ACCATCACCA AAATCTTGCT CGCCATACTC 4 500 

TGGTGCTCCA GGCTGGTATA ACCAAAGTGC CGTACTTCGT 4550 

GGGCTCATTC GTGCATGCAT GCTGGTGCGG AAGGTTGCTG 4 600 

TGTCCAAATG GCTCTCATGA AGTTGGCCGC ACTGA'CAGGT 4 650 

ATGACCATCT CACCCCACTG CGGGACTGGG CCCACGCGGG 4 700 

CTTGCGGTGG CAGTTGAGCC CGTCGTCTTC TCTGATATGG 4750 

TATCACCTGG GGGGCAGACA CCGCGGC GTG TGGGGACATC 4800 

TGCCCGTCTC CGCCCGCAGG GGGAGGGAGA TACATCTGGG 4 850 

AGCCTTGAAG GGCAGGGGTG GCGACTCCTC GCGCCTATTA 4 900 

CCAACAGACG CGAGGCCTAC TTGGCTGCAT CAT C ACT AGC 4 950 
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CTCACAGGCC 


GGGACAGGAA 


CCAGGTCGAG 


GGGGAGGTCC 


AAGTGGTCTC 


5000 




CACCGCAACA 


CAATCTTTCC 


TGGCGACCTG 


CGTCAATGGC 


GTGTGTTGGA 


5050 


5 


CTGTCTATCA 


TGGTGCCGGC 


TCAAAGACCC 


TTGCCGGCCC 


AAAGGGCCCA 


5100 




ATCACCCAAA 


TGTACACCAA 


TGTGGACCAG 


GACCTCGTCG 


GCTGGCAAGC 


5150 


10 


GCCCCCCGGG 


GCGCGTTCCT 


TGACACCATG 


CACCTGCGGC 


AGCTCGGACC 


5200 




TTTACTTGGT 


CACGAGGCAT 


GCCGATGTCA 


TTCCGGTGCG 


CCGGCGGGGC 


5250 


15 


GACAGCAGGG 


GGAGCCTACT 


CTCCCCCAGG 


CCCGTCTCCT 


ACTTGAAGGG 


5300 




CTCTTCGGGC 


GGTCCACTGC 


TCTGCCCCTC 


GGGGCACGCT 


GTGGGCATCT 


5350 


20 


TTCGGGCTGC 


CGTGTGCACC 


CGAGGGGTTG 


CGAAGGCGGT 


GGACTTTGTA 


5400 




CCCGTCGAGT 


CTATGGAAAC 


CACTATGCGG 


TCCCCGGTCT 


TCACGGACAA 


5450 


25 


CTCGTCCCCT 


CCGGCCGTAC 


CGCAGACATT 


CCAGGTGGCC 


CATCTACACG 


5500 


CCCCTACTGG 


TAGCGGCAAG 


AGCACTAAGG 


TGCCGGCTGC 


GTATGCAGCC 


5550 




CAAGGGTATA 


AGGTGCTTGT 


CCTGAACCCG 


TCCGTCGCCG 


CCACCCTAGG 


5600 


30 


TTTCGGGGCG 


TATATGTCTA 


AGGCACATGG 


TATCGACCCT 


AACATCAGAA 


5650 




CCGGGGTAAG 


GACCATCACC 


ACGGGTGCCC 


CCATCACGTA 


CTCCACCTAT 


5700 


35 


GGCAAGTTTC 


TTGCCGACGG 


TGGTTGCTCT 


GGGGGCGCCT 


AT G AC ATCAT 


5750 




AATATGTGAT 


GAGT GCC ACT 


CAACTGACTC 


GACCACTATC 


CTGGGCATCG 


5800 


40 


GCACAGTCCT 


GGACCAAGCG 


GAGACGGCTG 


GAGCGCGACT 


CGTCGTGCTC 


5850 




GCCACCGCTA 


CGCCTCCGGG 


ATCGGTCACC 


GTGCCACATC 


CAAACATCGA 


5900 


45 


GGAGGTGGCT 


CTGTCCAGCA 


CTGGAGAAAT 


CCCCTTTTAT 


GGCAAAGCCA 


5950 


TCCCCATCGA 


GACCATCAAG 


GGGGGGAGGC 


ACCTCATTTT 


CTGCCATTCC 


6000 




AAGAAGAAAT 


GTGATGAGCT 


CGCCGCGAAG 


CTGTCCGGCC 


TCGGACTCAA 


6050 


50 


TGCTGTAGCA 


TATTACCGGG 


GCCTTGATGT 


ATCCGTCATA 


CCAACTAGCG 


6100 




GAGACGTCAT 


TGTCGTAGCA 


ACGGACGCTC 


TAATGACGGG 


CTTTACCGGC 


6150 


55 


GATTTCGACT 


CAGTGATCGA 


CTGCAATACA 


TGTGTCACCC 


AGACAGTCGA 


6200 




CTTCAGCCTG 


GACCCGACCT 


TCACCATTGA 


GACGACGACC 


GTGCCACAAG 


6250 


60 








GGACTGGTAG 


GGGCAGGATG 


6300 


GGCATTTACA 


GGTTTGT G AC 


TCCAGGAGAA 


CGGCCCTCGG 


GCATGTTCGA 


6350 




TTCCTCGGTT 


CTGTGCGAGT 


GCTATGACGC 


GGGCTGTGCT 


TGGTACGAGC 


6400 


65 


TCACGCCCGC 


CGAGACCTCA 


GTTAGGTTGC 


GGGCTTACCT 


AAACACACCA 


6450 
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GGGTTGCCCG 


TCTGCCAGGA 


CCATCTGGAG 


TTCTGGGAGA 


GCGTCTTTAC 


6500. 




AGGCCTCACC 


CACATAGACG 


CCCATTTCTT 


GTCCCAGACT 


AAGCAGGCAG 


6550 




GAGACAACTT 


CCCCTACCTG 


GTAGCATACC 


AGGCTACGGT 


GTGCGCCAGG 


6600 


5 


GCTCAGGCTC 


CACCTCCATC 


GTGGGACCAA 


ATGTGGAAGT 


GTCTCATACG 


6650 




GCTAAAGCCT 


ACGCTGCACG 


GGCCAACGCC 


CCTGCTGTAT 


AGGCTGGGAG 


6700 


10 


CCGTTCAAAA 


CGAGGTTACT 


ACCACACACC 


C C AT AACCAA 


ATACATCATG 


6750 




GCATGCATGT 


CGGCTGACCT 


GGAGGTCGTC 


ACGAGCACCT 


GGGTGCTGGT 


6800 


15 


AGGCGG AGT C 


CTAGCAGCTC 


TGGCCGCGTA 


TTGCCTGACA 


ACAGGCAGCG 


6850 




TGGTCATTGT 


GGGCAGGATC 


ATCTTGTCCG 


GAAAGCCGGC 


CATCATTCCC 


6900 


20 


GACAGGGAAG 


TCCTTTACCG 


GGAGTTCGAT 


GAGATGGAAG 


AGTGCGCCTC 


6950 




ACACCTCCCT 


TACATCGAAC 


AGGGAATGCA 


GCTCGCCGAA 


CAATTCAAAC 


7000 


25 


AGAAGGCAAT 


CGGGTTGCTG 


CAAACAGCCA 


CCAAGCAAGC 


GGAGGCTGCT 


7050 


GCTCCCGTGG 


TGGAATCCAA 


GTGGCGGACC 


CTCGAAGCCT 


TCTGGGCGAA 


7100 




GCATATGTGG 


AATTTCATCA 


GCGGGATACA 


ATA^TTAGCA 


GGCTTGTCCA 


7150 


30 


CTCTGCCTGG 


CAACCCCGCG 


ATAGCATCAC 


TGATGGCATT 


CACAGCCTCT 


7200 




ATCACCAGCC 


CGCTCACCAC 


CCAACATACC 


CTCCTGTTTA 


ACATCCTGGG 


7250 


35 


GGGATGGGTG 


GCCGCCCAAC 


TTGCTCCTCC 


CAGCGCTGCT 


TCTGCTTTCG 


7300 




TAGGCGCCGG 


CATCGCTGGA 


GCGGCTGTTG 


GCAGCATAGG 


CCTTGGGAAG 


7350 


40 


GTGCTTGTGG 


ATATTTTGGC 


AGGTTATGGA 


GCAGGGGTGG 


CAGGCGCGCT 


7400 


CGTGGCCTTT 


AAGGTCATGA 


GCGGC GAG AT 


GCCCTCCACC 


GAGGACCTGG 


7450 




TTAACCTACT 


CCCTGCTATC 


CTCTCCCCTG 


GCGCCCTAGT 


CGTCGGGGT C 


7500 


45 


GTGTGCGCAG 


CGATACTGCG 


TCGGCACGTG 


GGCCCAGGGG 


AGGGGGCTGT 


7550 




GCAGTGGATG 


AACCGGCTGA 


TAGCGTTCGC 


TTCGCGGGGT 


AACCACGTCT 


7600 


50 


CCCCCACGCA 


CTATGTGCCT 


GAGAGCGACG 


CTGCAGCACG 


TGTCACTCAG 


7650 




ATCCTCTCTA 


GTCTTACCAT 


CACTCAGCTG 


CTGAAGAGGC 


TTCACCAGTG 


7700 


55 


GATCAACGAG 


GACTGCTCCA 


CGCCATGCTC 


CGGCTCGTGG 


CTAAGAGATG 


7750 




TTTGGGATTG 


GATATGCACG 


GTGTTGACTG 


AT T TC AAG AC 




7800 


60 


TCCAAGCTCC 


TGCCGCGATT 


GCCGGGAGTC 


CCCTTCTTCT 


CATGTCAACG 


7850 


TGGGTACAAG 


GGAGTCTGGC 


GGGGCGACGG 


CATCATGCAA 


ACCACCTGCC 


7900 




CATGTGGAGC 


ACAGATCACC 


GGACATGTGA 


AAAACGGTTC 


CATGAGGATC 


7950 


65 
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GTGGGGCCTA 
CGCGTACACC 
GGGCGCTGTG 
GGGGATTTCC 
GTGTCAGGTT 
TGCACAGGTA 
TTCCTGGTCG 
GCCCGAACCG 
ACATTACGGC 
TCCTTGGCCA 
AACATGCACT 
ACCTCCTGTG 
GAAAATAAGG 
GGATGAGAGG 
AATTCCCTCG 
CTGTTAGAGT 
GTGTCCATTG 
AGAGGACGGT 
CTCGCCACAA 
CACGGCAACG 
CCGACGTTGA 
GATCCCGATC 
TGAGGACGTC 
TCACGCCATG 
AACTCTTTGC 
CGCAAGCCTG 
ACGACCACTA 
GTTAAGGCTA 
ACATTCGGCC 
TATCCAGCAA 



GGACCTGTAG 
ACGGGCCCCT 
GCGGGTGGCT 
ACTACGTGAC 
CCGGCCCCCG 
CGCTCCAGCG 
GGCTCAATCA 
GACGTAGCAG 
GGAGACGGCT 
GCTCATCAGC 
ACCCGTCATG 
GCGGCAGGAG 
TAGTAATTTT 
GAAGTATCCG 
AGCGATGCCC 
CCTGGAAGGA 
CCGCCTGCCA 
TGTCCTGTCA 
AGACCTTCGG 
GCCTCTCCTG 
GTCGTACTCC 
TCAGCGACGG 
GTCTGCTGCT 
CGCTGCGGAG 
TCCGTCACCA 
CGGCAGAAGA 
CCGGGACGTG 
AACTTCTATC 
AGATCTAAAT 
GGCCGTTAAC 
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TAACACGTGG CAT GG AAC AT TCCCCATTAA 8000 

GCACGCCCTC CCCGGCGCCA AATTATTCTA 8050 

GCTGAGGAGT ACGTGGAGGT TACGCGGGTG 8100 

GGGCATGACC ACTGACAACG TAAAGTGCCC 8150 

AATTCTTCAC AGAAGTGGAT GGGGTGCGGT 8200 

TGCAAACCCC TCCTACGGGA GGAGGTCACA 8250 

ATACCTGGTT GGGTCACAGC TCCCATGCGA 8300 

TGCTCACTTC CATGCTCACC GACCCCTCCC 835 0 

AAGCGTAGGC TGGCCAGGGG ATCTCCCCCC 8400 

TAGCCAGCTG TCTGCGCCTT CCTTGAAGGC 8450 

ACTCCCCGGA CGCTGACCTC ATCGAGGCCA 8500 

ATGGGCGGGA ACATCACCCG CGTGG AGTCA 8550 

GGACTCTTTC GAGCCGCTCC AAGCGGAGGA 8 600 

TTCCGGCGGA GATCCTGCGG AGGTCCAGGA 8 650 

ATATGGGCAC GCCCGGATTA CAACCCTCCA 8700 

CCCGGACTAC GTCCCTCCAG TGGTACACGG 8750 

AGGCCCCTCC GATACCACCT CCACGGAGGA 8800 

GAATCTACCG TGTCTTCTGC CTTGGCGGAG 8850 

CAGCTCCGAA TCGTCGGCCG TCGACAGCGG 8900 

ACCAGCCCTC CGACGACGGC G AC GCGGGAT 8 950 

TCCATGCCCC CCCTTGAGGG GGAGCCGGGG 9000 

GTCTTGGTCT ACCGTAAGCG AGGAGGCTAG 9050 

CGATGTCCTA CACATGGACA GGCGCCCTGA 9100 

GAAACCAAGC TGCCCATCAA TGCACTGAGC 9150 

CAACTTGGTC TATGCTACAA CATCTCGCAG 9200 

AGGTCACCTT TGACAGACTG CAGGTCCTGG 9250 

CTCAAGGAGA TGAAGGCGAA GGCGTCCACA 9300 

CGTGGAGGAA GCC TGTAAGC TGACGCCCCC 9350 

TTGGCTATGG GGCAAAGGAC GTCCGGAACC 9400 

CACATCCGCT CCGTGTGGAA GGACTTGCTG 9450 
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GAAGACACTG AGACACCAAT TGACACCACC ATCATGGCAA AAAATGAGGT 9500 

TTTCTGCGTC CAACCAGAGA AGGGGGGCCG CAAGCCAGCT CGCCTTATCG 9550 

TATTCCCAGA TTTGGGGGTT CGTGTGTGCG AGAAAATGGC CCTTTACGAT 9600 

GTGGTCTCCA CCCTCCCTCA GGCCGTGATG GGCTCTTCAT ACGGATTCCA 965 0 

ATACTCTCCT GGACAGCGGG TCGAGTTCCT GGTGAATGCC TGGAAAGCGA 9700 

AGAAATGCCC TATGGGCTTC GCATATGACA CCCGCTGTTT TGACTCAACG 9750 

GTC ACT GAGA ATGACATCCG TGTTGAGGAG TCAATCTACC AATGTTGTGA 9800 

CTTGGCCCCC GAAGCCAGAC AGGCCATAAG GTCGCTCACA GAGCGGCTTT 9850 

ACATCGGGGG CCCCCTGACT AATTCTAAAG GGCAGAACTG CGGCTATCGC 9900 

CGGTGCCGCG CGAGCGGTGT ACTGACGACC AGCTGCGGTA ATACCCTCAC 9950 

ATGTTACTTG AAGGCCGCTG CGGCCTGTCG AGCTGCGAAG CTCCAGGACT 10000 

GCACGATGCT CGT AT GCGGA GACGACCTTG TCGTTATCTG TGAAAGCGCG 10050 

GGGACCCAAG AGGACGAGGC GAGCCTACGG GCCTTCACGG AGGCT AT G AC 10100 

TAGATACTCT GCCCCCCCTG GGGACCCGCC CAAACCAGAA TACGACTTGG 10150 

AGTTGATAAC ATCATGCTCC TCCAATGTGT CAGTCGCGCA CGATGCATCT 10200 

GGCAAAAGGG TGTACTATCT CACCCGTGAC CCCACCACCC CCCTTGCGCG 10250 

GGCTGCGTGG GAGACAGCTA GACACACTCC AGTCAATTCC TGGCTAGGCA 10300 

ACATCATCAT GTATGCGCCC ACCTTGTGGG CAAGGATGAT C C T GAT G ACT 10350 

CATTTCTTCT CCATCCTTCT AGCTCAGGAA C AACT T G AAA AAGCCCTAGA 10400 

TTGTCAGATC TACGGGGCCT GTTACTCCAT TGAGCCACTT GACCTACCTC 10450 

AGATCATTCA ACGACTCCAT GGCCTTAGCG CATTTTCACT CCATAGTTAC 10500 

TCTCCAGGTG AGATCAAT-AG GGTGGCTTCA TGCCTCAGGA AACTTGGGGT 10550 

ACCGCCCTTG CGAGTCTGGA GACAT CGGGC CAGAAGTGTC CGCGCTAGGC 10600 

T AC TGTCCC A GGGGGGGAGG GCTGCCACTT GTGGCAAGTA CCTCTTCAAC 10650 

TGGGCAGTAA GGACCAAGCT CAAACTCACT CCAATCCCGG CTGCGTCCCA 10700 

GTTGGATTTA TCCAGCTGGT TCGTTGCTGG TTACAGCGGG GGAGACATAT 10750 

ATCACAGCCT GTCTCGTGCC CGACCCCGCT GGTTCATGTG GTGCCTACTC 10800 

CTACTTTCTG TAGGGGTAGG CATC TAT CT A CTCCCCAACC GATGAACGGG 10850 

GAGCTAAACA CTCCAGGCCA ATAGGCCATC CTGTTTTTTT CCCTTTTTTT 10900 

TTTTCTTTTT TTTTTTTTTT TTTTTTTTTT TTTTTTTTTC TCCTTTTTTT 10950 
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TTCCTCTTTT TTTCCTTTTC TTTCCTTTGG TGGCTCCATC TTAGCCCTAG 11000 
TCACGGCTAG CTGTGAAAGG TCCGTGAGCC GCTTGACTGC AGAGAGTGCT 11050 

5 

GATACTGGCC TCTCTGCAGA TCAAGT 

10 

15 
20 
25 
30 
35 
40 
45 
50 
55 
60 
65 
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ANGABEN ZU SEQ ID-NO: 2 : 

SEQUENZCHARAKTERISTIKA: 
LANGE: 8637 Basenpaare 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE. linear 

ART DES MOLEKULS: Subgenom-RNA 

HYPOTHETISCH: Nein 

ANTI-SENSE: nein 

URSPRUNGLICHE HERKUNFT: 

ORGAN1SMUS: Hepatitis C Virus 
STAMM: Genotyp lb 
ENTWICKLUNGSSTADnjM: — 
ZELLTYP: — 

UNMITTELBARE HERKUNFT: 

Isolat aus humanen Leberzellen 

MERKMAL: 

NAME/SCHLUSSEL: kodierende Sequenz fiir Virusproteine 
LAGE: — 

ERMITTLUNGSMETHODE. . experimentell 



SEQUENZBESCHREIBUNG: SEQ ED-NO: 2 

Ii-3i7/NS2-3' /wt: 8637 bp 

GCCAGCCCCC GATTGGGGGC GACACTCCAC CATAGATCAC TCCCCTGTGA 

GGAACTACTG TCTTCACGCA GAAAGCGTCT AGCCATGGCG TTAGTATGAG 

TGTCGTGCAG CCTCCAGGAC CCCCCCTCCC GGGAGAGCCA TAGTGGTCTG 

CGGAAC CGGT GAGTACACCG GAATTGCCAG GACGACCGGG TCCTTTCTTG 

GATCAACCCG CTCAATGCCT GGAGATTTGG GCGTGCCCCC GCGAGACTGC 

TAGCCGAGTA GTGTTGGGTC GCGAAAGGCC TTGTGGTACT GCCTGATAGG 

GTGCTTGCGA GTGCCCCGGG AGGTCTCGTA GACCGTGCAC CAT GAGCACG 

AATCCTAAAC CT C AAAG AAA AACCAAAGGG CGCGCCATGA TTGAACAAGA 

TGGATTGCAC GCAGGTTCTC CGGCCGCTTG GGTGGAGAGG CTATTCGGCT 
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ATGACTGGGC ACAACAGACA ATCGGCTGCT CTGATGCCGC CGTGTTCCGG 500 

CTGTCAGCGC AGGGGCGCCC GGTTCTTTTT GTCAAGACCG ACCTGTCCGG 550 

5 

TGCCCTGAAT GAACTGCAGG ACGAGGCAGC GCGGCTATCG TGGCTGGCCA - 600 

CGACGGGCGT TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC TGAAGCGGGA 650 

0 

10 AGGGACTGGC TGCTATTGGG CGAAGTGCCG GGGCAGGATC TCCTGTCATC 700 

TCACCTTGCT CCTGCCGAGA AAGTATCCAT CAT GG CT GAT GCAATGCGGC 750 

15 GGCTGCATAC GCTTGATCCG GCTACCTGCC CATTCGACCA CCAAGCGAAA 800 

CATCGCATCG AGCGAGCACG TACTCGGATG GAAGCCGGTC TTGTCGATCA 850 

GGATGATCTG GACGAAGAGC ATCAGGGGCT CGCGCCAGCC GAACTGTTCG 900 

20 

CCAGGCTCAA GGCGCGCATG CCCGACGGCG AGGATCTCGT CGTGACCCAT 950 

GGCGATGCCT GCTTGCCGAA TATCATGGTG GAAAATGGCC GCTTTTCTGG 1000 

25 

ATTCATCGAC TGTGGCCGGC TGGGTGTGGC GGACCGCTAT CAGGACATAG 1050 

CGTTGGCTAC CCGTGATATT GCTGAAGAGC TTGGCGGCGA ATGGGCTGAC 1100 

30 

CGCTTCCTCG TGCTTTACGG TATCGCCGCT CCCGATTCGC AGCGCATCGC 1150 

CTTCTATCGC CTTCTTGACG AGTTCTTCTG AGTTTAAACA GACCACAACG 12 00 

35 GTTTCCCTCT AGCGGGATCA ATTCCGCCCC TCTCCCTCCC CCCCCCCTAA 1250 

CGTTACTGGC CGAAGCCGCT TGGAATAAGG CCGGTGTGCG TTTGTCTATA 1300 

TGTTATTTTC CACCATATTG CCGTCTTTTG GCAATGTGAG GGCCCGGAAA 1350 

40 

CCTGGCCCTG TCTTCTTGAC GAGCATTCCT AGGGGTCTTT CCCCTCTCGC 14 00 

CAAAGGAATG CAAGGTCTGT TGAATGTCGT GAAGGAAGCA GTTCCTCTGG 1450 

45 

AAGCTTCTTG AAGACAAACA ACGTCTGTAG CGACCCTTTG CAGGCAGCGG 15 00 

AACCCCCCAC CTGGCGACAG GTGCCTCTGC GGCCAAAAGC CACGTGTATA 1550 

50 AGATACACCT GCAAAGGCGG CACAACCCCA GTGCCACGTT GTGAGTTGGA 1600 

TAGTTGTGGA AAGAGT C AAA TGGCTCTCCT CAAGCGTATT CAACAAGGGG 165 0 

55 CTGAAGGATG CCCAGAAGGT ACCCCATTGT ATGGGATCTG ATCTGGGGCC 17 00 

TCGGTGCACA TGCTTTACAT GTGTTTAGTC GAGGTTAAAA AACGTCTAGG 1750 

CCCCCCGAAC CACGGGGACG TGGTTTTCCT T T G AAAAAC A CGATAATACC 1800 

60 

ATGGACCGGG AG AT GGC AGC ATCGTGCGGA GGCGCGGTTT TCGTAGGTCT 185 0 

GATACTCTTG ACCTTGTCAC CGCACTATAA GCTGTTCCTC GCTAGGCTCA 1900 

65 

TATGGTGGTT ACAATATTTT ATCACCAGGG CCGAGGCACA CTTGCAAGTG 1950 
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TGGATCCCCC CCCTCAACGT TCGGGGGGGC CGCGATGCCG TCATCCTCCT 2 000 

CACGTGCGCG ATCCACCCAG AGCTAATCTT TACCATCACC AAAATCTTGC 205 0 
TCGCCATACT CGGTCCACTC ATGGTGCTCO AGGGTGGTAT AACCAAAGTG ' 2100 

CCGTACTTCG TGCGCGCACA CGGGCTCATT CGTGCATGCA TGCTGGTGCG 215 0 

GAAGGTTGCT GGGGGTCATT ATGTCCAAAT GGCTCTCATG AAGTTGGCCG 22.00 

CACTGACAGG TACGTACGTT TATGACCATC TCACCCCACT GCGGGACTGG 2 250 

GCCCACGCGG GCCTACGAGA CCTTGCGGTG GCAGTTGAGC CCGTCGTCTT 2 300 is 

CTCTGATATG GAGACCAAGG TTATCACCTG GGGGGCAGAC ACCGCGGCGT 2350 

GT GGGG AC AT CATCTTGGGC CTGCCCGTCT CCGCCCGCAG GGGGAGGGAG 2 4 00 

AT AC AT CTGG GACCGGCAGA CAGCCTTGAA GGGCAGGGGT GGCGACTCCT 2 4 50 

CGCGCCTATT ACGGCCTACT CCCAACAGAC GCGAGGCCTA CTTGGCTGCA 25 00 

T CATC ACT AG CCTCACAGGC CGGGACAGGA ACCAGGTCGA GGGGGAGGTC 255 0 

CAAGTGGTCT CCACCGCAAC ACAATCTTTC CTGGCGACCT GCGTCAATGG 2 600 

CGTGTGTTGG ACTGTCTATC ATGGTGCCGG CTCAAAGACC CTTGCCGGCC 2 65 0 30 

CAAAGGGCCC AATCACCCAA ATGTACACCA ATGTGGACCA GGACCTCGTC 27 00 

GGCTGGCAAG CGCCCCCCGG GGCGCGTTCC TTGACACCAT GCACCTGCGG 27 5 0 

CAGCTCGGAC CTTTACTTGG TCACGAGGCA TGCCGATGTC ATTCCGGTGC 28 00 

GCCGGCGGGG CGACAGCAGG GGGAGCCTAC TCTCCCCCAG GCCCGTCTCC 28 5 0 

TACTTGAAGG GCTCTTCGGG CGGTCCACTG CTCTGCCCCT CGGGGCACGC 2 90 0 

TGTGGGCATC TTTCGGGCTG CCGTGTGCAC CCGAGGGGTT GCGAAGGCGG 2 95 0 

TGGACTTTGT ACCCGTCGAG TCTATGGAAA CCACTATGCG GTCCCCGGTC 3000 

TTCACGGACA ACTCGTCCCC TCCGGCCGTA CCGCAGACAT TCCAGGTGGC 3 050 

CCATCTACAC GCCCCTACTG GTAGCGGCAA GAGCACTAAG GTGCCGGCTG 3100 50 

CGTATGCAGC CCAAGGGTAT AAGGTGCTTG TCCTGAACCC GTCCGTCGCC 315 0 

GCCACCCTAG GTT TCGGGGC GTATATGTCT AAGGCACATG GTATCGACCC 32 00 

TAACATCAGA ACCGGGGTAA GGACCATCAC CACGGGTGCC CCCATCACGT 325 0 

ACTCCACCTA TGGCAAGTTT CTTGCCGACG GTGGTTGCTC TGGGGGCGCC 3300 

TATGACATCA TAATATGTGA TGAGTGCCAC TCAACTGACT CGACCACTAT 3350 

CCTGGGCATC GGCACAGTCC TGGACCAAGC GGAGACGGCT GGAGCGCGAC 34 00 

TCGTCGTGCT CGCCACCGCT ACGCCTCCGG GATCGGTCAC CGTGCCACAT 3 4 50 
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CCAAACATCG 


AGGAGGTGGC 


TCTGTCCAGC 


ACTGGAGAAA 


TCCCCTTTTA 


3500 




TGGCAAAGCC 


ATCCCCATCG 


AGACCATCAA 


GGGGGGGAGG 


CACCTCATTT 


3550 


5 


TCTGCCATTC 


CAAGAAGAAA 


TGTGATGAGC 


TCGCCGCGAA 


GCTGTCCGGC 


3600 




CTCGGACTCA 


ATGCTGTAGC 


ATATTACCGG 


GGCCTTGATG 


TATCCGTCAT 


3650 


10 


ACCAACTAGC 


GGAGACGTCA 


TTGTCGTAGC 


AACGGACGCT 


CTAATGACGG 


3700 




GCTTTACCGG 


CGATTTCGAC 


TCAGTGATCG 


ACTGCAATAC 


ATGTGTCACC 


3750 


15 


CAGACAGTCG 


ACTTCAGCCT 


GGACCCGACC 


TTCACCATTG 


AGACGACGAC 


3800 




CGTGCCACAA 


GACGCGGTGT 


CACGCTCGCA 


GCGGCGAGGC 


AGGACTGGTA 


3850 


20 


GGGGCAGGAT 


GGGCATTTAC 


AGGTTTGTGA 


CTCCAGGAGA 


ACGGCCCTCG 


3900 




GGCATGTTCG 


ATTCCTCGGT 


TCTGTGCGAG 


TGCTATGACG 


CGGGCTGTGC 


3950 


25 


TTGGTACGAG 


CTCACGCCCG 


CCGAGACCTC 


AGTTAGGTTG 


CGGGCTTACC 


4000 


TAAACACACC 


AGGGTTGCCC 


GTCTGCCAGG 


ACCATCTGGA 


GTTCTGGGAG 


4050 




AGCGTCTTTA 


CAGGCCTCAC 


CCACATAGAC 


GCCCATTTCT 


TGTCCCAGAC 


4100 


30 


TAAGCAGGCA 


GGAGACAACT 


TCCCCTACCT 


GGTAGCATAC 


CAGGCTACGG 


4150 




TGTGCGCCAG 


GGCTCAGGCT 


CCACCTCCAT 


CGTGGGACCA 


AATGTGGAAG 


4200 


35 


TGTCTCATAC 


GGCTAAAGCC 


TACGCTGCAC 


GGGCCAACGC 


CCCTGCTGTA 


4250 




TAGGCTGGGA 


GCCGTTCAAA 


ACGAGGTTAC 


TACCACACAC 


CCCATAACCA 


4300 


40 


AATACATCAT 


GGCATGCATG 


TCGGCTGACC 


TGGAGGTCGT 


CACGAGCACC 


4350 




TGGGTGCTGG 


TAGGCGGAGT 


CCTAGCAGCT 


CTGGCCGCGT 


ATTGCCTGAC 


4400 


45 


AACAGGCAGC 


GTGGTCATTG 


TGGGCAGGAT 


CATCTTGTCC 


GGAAAGC CGG 


4 450 


CCATCATTCC 


CGACAGGGAA 


GTCCTTTACC 


GGGAGTTCGA 


T GAG AT G G AA 


4500 




GAGTGCGCCT 


CACACCTCCC 


TTACATCGAA 


CAGGGAATGC 


AGCTCGCCGA 


4550 


50 


ACAATTCAAA 


CAGAAGGCAA 


TCGGGTTGCT 


GCAAACAGCC 


ACCAAGCAAG 


4 600 




CGGAGGCTGC 


TGCTCCCGTG 


GTGGAATCCA 


AGTGGCGGAC 


CCTCGAAGCC 


4 650 


55 


TTCTGGGCGA 


AGCATATGTG 


GAATTTCATC 


AGCGGGATAC 


AATATTTAGC 


4700 




AGGCTTGTCC 


ACTCTGCCTG 


GCAACCCCGC 


GATAGCATCA 


CTGATGGCAT 


4750 


60 


TCACAGCCTC 






CCCAACATAC 


CCTCCTGTTT 


4800 


AACATCCTGG 


GGGGATGGGT 


GGCCGCCCAA 


CTTGCTCCTC 


CCAGCGCTGC 


4850 




TTCTGCTTTC 


GTAGGCGCCG 


GCATCGCTGG 


AGCGGCTGTT 


GGCAGCATAG 


4900 


65 


GCCTTGGGAA 


GGTGCTTGTG 


GATATTTTGG 


CAGGTTATGG 


AGCAGGGGTG 


4950 
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GTCGACAGCG 


GCACGGCAAC 


GGCCTCTCCT 


GACCAGCCCT 


CCGACGACGG 


6500 




CGACGCGGGA 


TCCGACGTTG 


AGTCGTACTC 


CTCCATGCCC 


CCCCTTGAGG 


6550 


5 


GGGAGCCGGG 


GGATCCCGAT 


CTCAGCGACG 


GGTCTTGGTC 


TACCGTAAGC 


■' 6600 




GAGGAGGCTA 


GTGAGGACGT 


CGTCTGCTGC 


TCGATGTCCT 


AC AC AT GG AC 


6650 


10 


AGGCGCCCTG 


ATCACGCCAT 


GCGCTGCGGA 


GGAAACCAAG 


CTGCCCATCA 


6700 




ATGCACTGAG 


CAACTCTTTG 


CTCCGTCACC 


ACAACTTGGT 


CTATGCTACA 


6750 


15 


ACATCTCGCA 


GCGCAAGCCT 


GCGGCAGAAG 


AAGGTCACCT 


TTGACAGACT 


6800 




GCAGGTCCTG 


GACGACCACT 


ACCGGGACGT 


GCTCAAGGAG 


AT G AAGGC G A 


6850 


20 


AGGCGTCCAC 


AGTTAAGGCT 


AAACTTCTAT 


CCGTGGAGGA 


AGCCTGTAAG 


6900 




CTGACGCCCC 


CACATTCGGC 


CAGATCTAAA 


TTTGGCTATG 


GGGCAAAGGA 


6950 


25 


CGTCCGGAAC 


CTATCCAGCA 


AGGCCGTTAA 


CCACATCCGC 


TCCGTGTGGA 


7000 


AGGACTTGCT 


GGAAGACACT 


GAGACACCAA 


TTGACACCAC 


CATCATGGCA 


7050 




AAAAATGAGG 


TTTTCTGCGT 


C C AAC C AG AG 


AAGGGGGGCC 


GCAAGCCAGC 


7100 


30 


TCGCCTTATC 


GTATTCCCAG 


ATTTGGGGGT 


TCGTGTGTGC 


GAGAAAATGG 


7150 




CCCTTTACGA 


TGTGGTCTCC 


ACCCTCCCTC 


AGGCCGTGAT 


GGGCTCTTCA 


7200 


35 


TACGGATTCC 


AATACTCTCC 


TGGACAGCGG 


GTCGAGTTCC 


TGGTGAATGC 


7250 




CTGGAAAGCG 


AAGAAATGCC 


CTATGGGCTT 


CGCATATGAC 


ACCCGCTGTT 


7300 


40 


TTG AC TCAAC 


GG T C AC TG AG 


AATGACATCC 


GTGTTGAGGA 


GTCAATCTAC 


7350 




CAATGTTGTG 


ACTTGGCCCC 


CGAAGCCAGA 


CAGGCCATAA 


GGTCGCTCAC 


7400 


45 


AGAGCGGCTT 


TACATCGGGG 


GCCCCCTGAC 


TAATTCTAAA 


GGGCAGAACT 


7450 


GCGGCTATCG 


CCGGTGCCGC 


GCGAGCGGTG 


TACTGACGAC 


CAGCTGCGGT 


7500 




AATACCCTCA 


CATGTTACTT 


GAAGGCCGCT 


GCGGCCTGTC 


GAGCTGCGAA 


7550 


50 


GCTCCAGGAC 


TGCACGATGC 


TCGTATGCGG 


AGACGACCTT 


GTCGTTATCT 


7600 




GTGAAAGCGC 


GGGGACCCAA 


GAGGACGAGG 


CGAGCCTACG 


GGCCTTCACG 


7650 


55 


GAGGCTATGA 


CTAGATACTC 


TGCCCCCCCT 


GGGGACCCGC 


CCAAACCAGA 


7700 




ATACGACTTG 


GAGTTGATAA 


CATCATGCTC 


CTCCAATGTG 


TCAGTCGCGC 


7750 


60 


ACGATGCATC 


TGGCAAAAGG 








78 00 


CCCCTTGCGC 


GGGCTGCGTG 


GGAGACAGCT 


AGACACACTC 


CAGTCAATTC 


7850 




CTGGCTAGGC 


AAC AT C AT C A 


TGTATGCGCC 


CACCTTGTGG 


GCAAGGATGA 


7900 


65 


TCCTGATGAC 


TCATTTCTTC 


TCCATCCTTC 


TAGCTCAGGA 


AC AAC T T G AA 


7950 
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AAAGCCCTAG ATTGTCAGAT CTACGGGGCC TGTTACTCCA TTGAGCCACT 8000 

TGACCTACCT CAGATCATTC AACGACTCCA TGGCCTTAGC GCATTTTCAC 8050 

TCCATAGTTA CTCTCCAGGT GAGATCAATA GGGTGGCTTC ATGCCTCAGG 8100 

AAACTTGGGG TACCGCCCTT GCGAGTCTGG AGACATCGGG CCAGAAGTGT 815 0 

CCGCGCTAGG CTACTGTCCC AGGGGGGGAG GGCTGCCACT TGTGGCAAGT 82 00 

ACCTCTTCAA CTGGGCAGTA AGGACCAAGC TCAAACTCAC TCCAATCCCG 8250 

GCTGCGTCCC AGTTGGATTT ATCCAGCTGG TTCGTTGCTG GTTACAGCGG 8 300 15 

GGGAGACATA TAT C AC AGCC TGTCTCGTGC CCGACCCCGC TGGTTCATGT 8350 

GGTGCCTACT CCTACTTTCT GTAGGGGTAG GCATCTATCT ACTCCCCAAC 84 00 

CGATGAACGG GGAGCTAAAC ACTCCAGGCC AATAGGCCAT CCTGTTTTTT 8450 

TCCCTTTTTT TTTTTCTTTT TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT 8500 

CTCCTTTTTT TTTCCTCTTT TTTTCCTTTT CTTTCCTTTG GTGGCTCCAT 855 0 

CTTAGCCCTA GTCACGGCTA GCTGTGAAAG GTCCGTGAGC CGCTTGACTG 8 600 

C AG AG AG T GC TGATACTGGC CTCTCTGCAG ATCAAGT 
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ANGABEN ZU SEQ ID-NO: 3 : 

SEQUENZCHARAKTERI STEKA: 
LANGE: 8001 Basenpaare 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: Subgenom-RNA 

HYPOTHETISCH: Nein 

ANTI-SENSE: nein 

URSPRUNGLICHE HERKUNFT: 

ORGANISMUS: Hepatitis C Virus 
STAMM: Genotyp lb 
ENTWICKLUNGSSTADIUM: — 
ZELLTYP: — 

UNMITTELBARE HERKUNFT: 

Isolat aus humanen Leberzellen 

MERKMAL. 

NAME/SCHLUSSEL: kodierende Sequenz fur Virusproteine 
LAGE: — 

ERMITTLUNGSMETHODE: . experimentell 



SEQUENZBESCHREIBUNG: SEQ ID-NO: 3 

l3 B9 /NS3-3'/wt: 8001 bp 

GCCAGCCCCC GATTGGGGGC GACACTCCAC CATAGATCAC TCCCCTGTGA 
GGAACTACTG TCTTCACGCA GAAAGCGTCT AGCCATGGCG TTAGTATGAG 
TGTCGTGCAG CCTCCAGGAC CCCCCCTCCC GGGAGAGCCA TAGTGGTCTG 
CGGAACCGGT GAGTACACCG GAATTGCCAG GACGACCGGG TCCTTTCTTG 
GATCAACCCG CTCAATGCCT GGAGATTTGG GCGTGCCCCC GCGAGACTGC 
TAGCCGAGTA GTGTTGGGTC GCGAAAGGCC TTGTGGTACT GCCTGATAGG 
GTGCTTGCGA GTGCCCCGGG AGGTCTCGTA GACCGTGCAC CATGAGCACG 
AATCCTAAAC CTCAAAGAAA AACCAAACGT AACACCAACG GGCGCGCCAT 



30 



GATTGAACAA 
GGCTATTCGG 
GCCGTGTTCC 
CGACCTGTCC 
CGTGGCTGGC 
ACTGAAGCGG 
TCTCCTGTCA 
ATGCAATGCG 
CACCAAGCGA 
TCTTGTCGAT 
CCGAACTGTT 
GTCGTGACCC 
CCGCTTTTCT 
ATCAGGACAT 
GAATGGGCTG 
GCAGCGCATC 
CAGACCACAA 
CCCCCCCCCT 
CGTTTGTCTA 
AGGGCCCGGA 
TTCCCCTCTC 
CAGTTCCTCT 
TGCAGGCAGC 
GCCACGTGTA 
TTGTGAGTTG 
TTCAACAAGG 
TGATCTGGGG 
AAAACGT CT A 
CACGATAATA 
CCTACTTGGC 
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GATGGATTGC ACGCAGGTTC TCCGGCCGCT TGGGTGGAGA 450 

CTATGACTGG GCACAACAGA CAATCGGCTG CTCTGATGCC 500 

GGCTGTCAGC GCAGGGGCGC CCGGTTCTTT TTGTCAAGAC 550 

GGTGCCCTGA ATGAACTGCA GGACGAGGCA GCGCGGCTAT 600 

CACGACGGGC GTTCCTTGCG CAGCTGTGCT CGACGTTGTC 650 

GAAGGGACTG GCTGCTATTG GGCGAAGTGC CGGGGCAGGA 700 

TCTCACCTTG CTCCTGCCGA GAAAGTATCC ATCATGGCTG 750 

GCGGCTGCAT ACGCTTGATC CGGCTACCTG CCCATTCGAC 800 

AACATCGCAT CGAGCGAGCA CGTACTCGGA TGGAAGCCGG 850 

CAGGATGATC TGGACGAAGA GCATCAGGGG CTCGCGCCAG 900 

CGCCAGGCTC AAGGCGCGCA TGCCCGACGG CGAGGATCTC 950 

ATGGCGATGC CTGCTTGCCG AATATCATGG TGGAAAATGG 1000 

GGATTCATCG ACTGTGGCCG GCTGGGTGTG GCGGACCGCT 1050 

AGCGTTGGCT ACCCGTGATA TTGCTGAAGA GCTTGGCGGC 1100 

ACCGCTTCCT CGTGCTTTAC GGTATCGCCG CTCCCGATTC 1150 

GCCTTCTATC GCCTTCTTGA CGAGTTCTTC TGAGTTTAAA 1200 

CGGTTTCCCT CTAGCGGGAT CAATTCCGCC CCTCTCCCTC 1250 

AACGTTACTG GCCGAAGCCG CTTGGAATAA GGCCGGTGTG 1300 

TATGTTATTT TCCACCATAT TGCCGTCTTT TGGCAATGTG 1350 

AACCTGGCCC TGTCTTCTTG ACGAGCATTC CTAGGGGTCT 14 00 

GCCAAAGGAA TGCAAGGTCT GTTGAATGTC GTGAAGGAAG 14 50 

GGAAGCTTCT T G AAG AC AAA CAACGTCTGT AGCGACCCTT 1500 

GGAACCCCCC ACCTGGCGAC AGGTGCCTCT GCGGCCAAAA 1550 

TAAGATACAC CTGCAAAGGC GGCACAACCC CAGTGCCACG 1600 

GATAGTTGTG GAAAGAGTCA AATGGCTCTC CTCAAGCGTA 1650 

GGCTGAAGGA TGCCCAGAAG GTACCCCATT GTATGGGATC 17 00 

CCTCGGTGCA CATGCTTTAC ATGTGTTTAG TCGAGGTTAA 1750 

GGCCCCCCGA ACCACGGGGA CGTGGTTTTC CTTTGAAAAA 1800 

CCATGGCGCC TATTACGGCC TACTCCCAAC AGACGC GAGG 1850 

TGCATCATCA CTAGCCTCAC AGGCCGGGAC AGGAACCAGG 1900 
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TCGAGGGGGA GGTCCAAGTG GTCTCCACCG 


CAACACAATC 


TTTCCTGGCG 


1950 


5 


ACCTGCGTCA ATGGCGTGTG TTGGACTGTC 


TATCATGGTG 


CCGGCTCAAA 


2000 

£• \J \J \J 




GACCCTTGCC 


GGCCCAAAGG 


> GCCCAATCAC 


CCAAATGTAC 


ACCAATGTGG 


2050 




ACCAGGACCT 


CGTCGGCTGG 


CAAGCGCCCC 


CCGGGGCGCG 


TTCCTTGACA 


2100 


10 


CCATGCACCT 


GCGGCAGCTC 


GGACCTTTAC 


TTGGTCACGA 


GGCATGCCGA 


2150 




TGTCATTCCG 


GTGCGCCGGC 


GGGGCGACAG 


CAGGGGGAGC 


CTACTCTCCC 


2200 


15 


CCAGGCCCGT 


CTCCTACTTG 


AAGGGCTCTT 


CGGGCGGTCC 


ACTGCTCTGC 


99S0 




CCCTCGGGGC 


ACGCTGTGGG 


CATCTTTCGG 


GCTGCCGTGT 


GCACCCGAQf; 




20 


GGTTGCGAAG 


GCGGTGGACT 


TTGTACCCGT 


CGAGTCTATG 


GAAAPPAPTA 


6JJU 




TGCGGTCCCC 


GGTCTTCACG 


GACAACTCGT 


CCCCTCCGGC 


CGTACCGPAC^ 


9 4 on 


25 


ACATTCCAGG 


TGGCCCATCT 


ACACGCCCCT 


ACTGGTAGCG 


GCAAGAGCAC 


94S0 

i. T «J U 


TAAGGTGCCG 


GCTGCGTATG 


CAGCCCAAGG 


GTATAAGGTG 


CTTGTCPTGA 


2^00 




ACCCGTCCGT 


CGCCGCCACC 


CTAGGTTTCG 


GGGCGTATAT 


GTCT AAGGT A 


9 s s n 

J ^ u 


30 


CATGGTATCG 


ACCCTAACAT 


CAGAACCGGG 


GTAAGGACCA 


TP Apr Acaczn, 


ZDUU 




TGCCCCCATC 


ACGTACTCCA 


CCTATGGCAA 


GTTTCTTGCC 


f^ApniPTf^PTT 


o ^e n 

*i DO u 


35 


GCTCTGGGGG 


CGCCTATGAC 


ATCATAATAT 


GTGATGAGTG 


PPAPTPA APT 






GACTCGACCA 


CTATCCTGGG 


CATCGGCACA 


GTCCTGGACC 




97 sn 


40 


GGCTGGAGCG 


CGACTCGTCG 


TGCTCGCCAC 


CGCTACGCCT 




9ft on 




TCACCGTGCC 


ACATCCAAAC 


ATCGAGGAGG 


TGGCTCTGTC 


CAC5PAPTr;PA 


open 


45 


GAAATCCCCT 


TTTATGGCAA 


AGCCATCCCC 


ATCGAGACCA 




9 Qnn 


GAGGCACCTC 


ATTTTCTGCC 


AT TCCAAG AA 


G AAAT GTGAT 




9 QRn 

^ ^ w? U 




CGAAGCTGTC 


CGGCCTCGGA 


CTCAATGCTG 


TAGCATATTA 


PPC^C^PPTT 


o u u u 


50 


GATGTATCCG 


TCATACCAAC 


TAGCGGAGAC 


GTCATTGTCG 


TAGCAACRRA 






CGCTCTAATG 


ACGGGCTTTA 


CCGGCGATTT 


CGACTCAGTG 


ATPC; APTf^P A 


on 

O J. W \J 


55 


ATACATGTGT 


CACCCAGACA 


GTCGACTTCA 


GCCTGGACCC 


G APPTTP APP 






ATTGAGACGA 


CGACCGTGCC 


ACAAGACGCG 


GTGTCAPGPT 






60 


AGGCAGGACT 


GGTAGGGGCA 


GGATGGGCAT 


TTACAGGTTT 


GTGACTCCAG 


3250 




GAGAACGGCC 


CTCGGGCATG 


TTCGATTCCT 


CGGTTCTGTG 


CGAGTGCTAT 


3300 




GACGCGGGCT 


GTGCTTGGTA 


CGAGCTCACG 


CCCGCCGAGA 


CCTCAGTTAG 


3350 


65 


GTTGCGGGCT 


TACCTAAACA 


CACCAGGGTT 


GCCCGTCTGC 


CAGGACCATC 


3400 
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TGGAGTTCTG GGAGAGCGTC TTTACAGGCC TCACCCACAT AG ACGCC CAT 3450 

TTCTTGTCCC AGAC TAAGCA GGCAGGAGAC AACTTCCCCT ACCTGGTAGC 3500 

ATACCAGGCT ACGGTGTGCG CGAGGGCTCA GGCTCCACCT CCATCGTGGG 3550 

ACCAAATGTG GAAGTGTCTC ATACGGCTAA AGCCTACGCT GC AC GGGCC A 3600 

ACGCCCCTGC TGTATAGGCT GGGAGCCGTT CAAAACGAGG TTACTACCAC 3650 

ACACCCCATA ACCAAATACA TCATGGCATG CATGTCGGCT GACCTGGAGG 3700 

TCGTCACGAG CACCTGGGTG CTGGTAGGCG GAGTCCTAGC AGCTCTGGCC 3750 

GCGTATTGCC TGACAACAGG CAGCGTGGTC ATTGTGGGCA GGATCATCTT 3800 

GTCCGGAAAG CCGGCCATCA TTCCCGACAG GGAAGTCCTT TACCGGGAGT 3850 

TCGATGAGAT GGAAGAGTGC GCCTCACACC TCCCTTACAT CGAACAGGGA 3900 

ATGCAGCTCG CCGAACAATT CAAACAGAAG GCAATCGGGT TGCTGCAAAC 3950 

AGCCACCAAG CAAGCGGAGG CTGCTGCTCC CGTGGTGGAA TCCAAGTGGC 4000 

GGACCCTCGA AGCCTTCTGG GCGAAGCATA TGTGGAATTT CAT C AGCGGG 4050 

ATACAATATT TAGCAGGCTT GTCCACTCTG CCTGGCAACC CCGCGATAGC 4100 

ATCACTGATG GCATTCACAG CCTCTATCAC CAGCCCGCTC ACCACCCAAC 4150 

ATACCCTCCT GTTTAACATC CTGGGGGGAT GGGTGGCCGC CCAACTTGCT 4200 

CCTCCCAGCG CTGCTTCTGC TTTCGTAGGC GCCGGCATCG CTGGAGCGGC 4250 

TGTTGGCAGC ATAGGCCTTG GGAAGGTGCT TGTGGATATT TTGGCAGGTT 4300 

ATGGAGCAGG GGTGGCAGGC GCGCTCGTGG CCTTTAAGGT CATGAGCGGC 4350 

GAGATGCCCT CCACCGAGGA CCTGGTTAAC CTACTCCCTG CTATCCTCTC 4400 

CCCTGGCGCC CTAGTCGTCG GGGTCGTGTG CGCAGCGATA CTGCGTCGGC 4 4 50 

ACGTGGGCCC AGGGGAGGGG GCTGTGCAGT GGATGAACCG GCTGATAGCG 4500 

TTCGCTTCGC GGGGTAACCA CGTCTCCCCC ACGCACTATG TGCCTGAGAG 4 550 

CGACGCTGCA GCACGTGTCA CTCAGATCCT CTCTAGTCTT ACCATCACTC 4 600 

AGCTGCTGAA GAGGCTTCAC C AGTGG AT C A ACGAGGACTG CTCCACGCCA 4650 

TGCTCCGGCT CGTGGCTAAG AGATGTTTGG GATTGGATAT GCACGGTGTT 4700 

GACTGATTTC AAGACCT GGC TCCAGTCCAA GCTCCTGCCG CGATTGCCGG 4750 

GAGTCCCCTT CTTCTCATGT CAACGTGGGT ACAAGGGAGT CTGGCGGGGC 4800 

GACGGCATCA TGCAAACCAC CTGCCCATGT GGAGCACAGA TCACCGGACA 4850 

TGTGAAAAAC GGTTCCATGA GGATCGTGGG GCCTAGGACC TGTAGTAACA 4 900 
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CGTGGCATGG 


AACATTCCCC 


ATTAACGCGT 


ACACCACGGG 


CCCCTGCACG 


4 950 


5 


CCCTCCCCGG 


: CGCCAAATTA 


. TTCTAGGGCG 


CTGTGGCGGG 


TGGCTGCTGA 


5000 




GGAGTACGTG 


GAGGTTACGC 


GGGTGGGGGA 


TTTCCACTAC 


GTGACGGGCA 


5050 




TGACCACTGA 


CAACGTAAAG 


TGCCCGTGTC 


AGGTTCCGGC 


CCCCGAATTC 




10 


TTCACAGAAG 


TGGATGGGGT 


GCGGTTGCAC 


AGGTACGCTC 


CAGCGTGCAA 


51 50 

*»J _L w» v 




ACCCCTCCTA 


CGGGAGGAGG 


TCACATTCCT 


GGTCGGGCTC 


AATP A AT ArP 


soon 


15 


TGGTTGGGTC 


ACAGCTCCCA 


TGCGAGCCCG 


AACCGGACGT 


ART A P/TPP T P 


R 9 *s n 




ACTTCCATGC 


TCACCGACCC 


CTCCCACATT 


ACGGCGGAGA 


C GOP T A A f^P CI 




20 


TAGGCTGGCC 


AGGGGATCTC 


CCCCCTCCTT 


GGCCAGCTCA 


TCAGPTAHPP 


J O J VJ 




AGCTGTCTGC 


GCCTTCCTTG 


AAGGCAACAT 


GCACTACCCG 


TCATGAPTPP 




25 


CCGGACGCTG 


ACCTCATCGA 


GGCCAACCTC 


CTGTGGCGGC 


AGGAGATGRP, 




CGGGAACATC 


ACCCGCGTGG 


AGTCAGAAAA 


T AAGGT AGT A 


A-L i. J. i. VjVj.fiV_» X 


DO UU 




CTTTCGAGCC 


GCTCCAAGCG 


GAGGAGGATG 


AG Annr; a apt 


A T p p r""P t f* r* r* 


CCCA 

jjju 


30 


GCGGAGATCC 


TGCGGAGGTC 


CAGGAAATTC 


cctpgagpc^a 


TPIPPP ATA T<*2 


^ con 




GGCACGCCCG 


GATTACAACC 


CTCCACTGTT 


AGAGTCCTC4G 


A appappppp 


c: c n 


35 


ACTACGTCCC 


TCCAGTGGTA 


CACGGGTGTC 


CATTGCPGPP 


Tnrr a appipp 


en nn 
o / u u 




CCTCCGATAC 


CACCTCCACG 


GAGGAAGAGG 


ACGGTTGTPC 


TP/TP AP, A ATP 


J / jU 


40 


TACCGTGTCT 


TCTGCCTTGG 


CGGAGCTCGC 




1 1 OurtjrOALyO 1 


c q nPi 
DoUU 




CCGAATCGTC 


GGCCGT CG AC 


AGC GGC ACGG 






CQCA 

OojU 


45 


CCCTCCGACG 


ACGGCGACGC 


GGGATCCGAC 


pttp aptppt 1 


-HO 1 LL 1 


jyuu 


GCCCCCCCTT 


GAGGGGGAGC 


CGGGGGATCC 


CGATPTPAPP* 


papppptphpt' 


o you 




GGTCTACCGT 


AAGCGAGGAG 


GCTAGTGAGG 




PTPP TP P 2\ T 1 


Pi n 


50 


T CCT AC AC AT 


GGACAGGCGC 


CCTGATCACG 


CCATGCGCTG 


PPPAPP A A AP 


OUjU 




CAAGCTGCCC 


ATCAATGCAC 


TGAGCAACTC 


X X X Ov> X X 


P APP AP A Tv PT 


DlUU 


55 


TGGTCTATGC 


TACAACATCT 


CGCAGCGCAA 


GCCTGCGGPA 


P A AP A APPTP 


DijU 




ACCTTTGACA 


GACTGCAGGT 


CCTGGACGAC 


CACTAPPQf^n 


APPTPPTP A 1\ 


conn 


60 




GCGAAGGCGT 


CCACAGTTAA 


GGCTAAACTT 


CTATCCGTGG 


6250 




AGGAAGCCTG 


TAAGCTGACG 


CCCCCACATT 


CGGCCAGATC 


TAAATTTGGC 


6300 


65 


TATGGGGCAA 


AGGACGTCCG 


GAACCTATCC 


AGCAAGGCCG 


TTAACCACAT 


6350 


CCGCTCCGTG 


TGGAAGGACT 


TGCTGGAAGA 


CACTGAGACA 


CCAATTGACA 


6400 
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CCACCATCAT GGCAAAAAAT GAGGTTTTCT GCGTCCAACC AGAGAAGGGG 6450 

GGCCGCAAGC CAGCTCGCCT TATCGTATTC CCAGATTTGG GGGTTCGTGT 6500 

GTGCGAGAAA ATGGCCCTTT ACGATGTGGT CTCCACCCTC CCTCAGGCCG 6550 

TGATGGGCTC TTCATACGGA TTCCAATACT CTCCTGGACA GCGGGTCGAG 6600 

TTCCTGGTGA ATGCCTGGAA AGCGAAGAAA TGCCCTATGG GCTTCGCATA 6650 

TGACACCCGC TGTTTTGACT CAACGGTCAC TGAGAATGAC ATCCGTGTTG 6700 

AGGAGTCAAT CTACCAATGT TGTGACTTGG CCCCCGAAGC CAGACAGGCC 6750 

ATAAGGTCGC TCACAGAGCG GCTTT AC AT C GGGGGCCCCC TGACTAATTC 6800 

TAAAGGGCAG AACTGCGGCT ATCGCCGGTG CCGCGCGAGC GGTGTACTGA 6850 

CGACCAGCTG CGGTAATACC CTCACAT GTT ACTTGAAGGC CGCTGCGGCC 6900 

TGTCGAGCTG CGAAGCTCCA GGACTGCACG ATGCTCGTAT GCGGAGACGA 6950 

CCTTGTCGTT ATCT GT G AAA GCGCGGGGAC CCAAGAGGAC GAGGCGAGCC 7000 

TACGGGCCTT CACGGAGGCT ATGACTAGAT ACTCTGCCCC CCCTGGGGAC 7050 

CCGCCCAAAC CAGAATACGA CTTGGAGTTG ATAACATCAT GCTCCTCCAA 7100 

TGTGTCAGTC GCGCACGATG CATCTGGCAA AAGGGTGTAC TATCTCACCC 7150 

GTGACCCCAC CACCCCCCTT GCGCGGGCTG CGTGGGAGAC AGCTAGACAC 7200 

ACTCCAGTCA ATTCCTGGCT AGGCAACATC ATCATGTATG CGCCCACCTT 7250 

GTGGGCAAGG ATGATCCTGA TGACTCATTT CTTCTCCATC CTTCTAGCTC 7300 

AGGAACAACT TGAAAAAGCC CTAGATTGTC AGATCTACGG GGCCTGTTAC 7350 

TCCATTGAGC CACTTGACCT ACCTCAGATC ATTCAACGAC TCCATGGCCT 7400 

TAGCGCATTT TCACTCCATA GTTACTCTCC AGGTGAGATC AATAGGGTGG 7 450 

CTTCATGCCT CAGGAAACTT GGGGTACCGC CCTTGCGAGT CTGGAGACAT 7500 

CGGGCCAGAA GTGTCCGCGC TAGGCTACTG TCCCAGGGGG GGAGGGCTGC 7550 

CACTTGTGGC AAGTACCTCT TCAACTGGGC AGTAAGGACC AAGCTCAAAC 7600 

TCACTCCAAT CCCGGCTGCG TCCCAGTTGG ATTTATCCAG CTGGTTCGTT 7 650 

GCTGGTTACA GCGGGGGAGA CATATATCAC AGCCTGTCTC GTGCCCGACC 7700 

CCGCTGGTTC ATGTGGTGCC TACTCCTACT TTCTGTAGGG GTAGGCATCT 7750 

ATCTACTCCC CAACCGATGA ACGGGGAGCT AAACACTCCA GGCCAATAGG 7800 

CCATCCTGTT TTTTTCCCTT TTTTTTTTTC TTTTTTTTTT TTTTTTTTTT 7850 

TTTTTTTTTT TTTTCTCCTT TTTTTTTCCT CTTTTTTTCC TTTTCTTTCC 7900 
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TTTGGTGGCT CCATCTTAGC CCTAGTCACG GCTAGCTGTG AAAGGTCCGT 7950 
GAGCCGCTTG ACTGCAGAGA GTGC TGATAC TGGCCTCTCT GCAGATCAAG 8000 

5 
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ANGABEN ZU SEQ ID-NO:4 : 

SEQUENZCH ARAKTERI STEKA: 
LANGE: 7989 Basenpaare 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: Subgenom-RNA 

H YPOTHETI SCH: Nein 

ANTI-SENSE: nein 

URSPRUNGL1CHE HERKUNFT: 

ORGANISMUS: Hepatitis C Virus 
STAMM: Genotyp lb 
ENTW1CKLUNGSSTADIUM: — 
ZELLTYP: — 

UNMITTELBARE HERKUNFT: 

Isolat aus humanen Leberzellen 

MERKMAL. 

NAME/SCHLUSSEL: kodierende Sequenz fur Virusproteine 
LAGE: — 

ERMITTLUNGSMETHODE: . experimentell 



SEQUENZBESCHREIBUNG: SEQ K>-NO: 4 
I377/NS3-3 1 /wt: 7989 bp 

GCCAGCCCCC GATTGGGGGC GACACTCCAC CATAGATCAC TCCCCTGTGA 
GGAACTACTG TCTTCACGCA GAAAGCGTCT AGCCATGGCG TTAGTATGAG 
TGTCGTGCAG CCTCCAGGAC CCCCCCTCCC GGGAGAGCCA TAGTGGTCTG 
CGGAACCGGT GAGTACACCG GAATTGCCAG GACGACCGGG TCCTTTCTTG 
GATCAACCCG CTCAATGCCT GGAGATTTGG GCGTGCCCCC GCGAGACTGC 
TAGCCGAGTA GTGTTGGGTC GCGAAAGGCC TTGTGGTACT GCCTGATAGG 
GTGCTTGCGA GTGCCCCGGG AGGTCTCGTA GACCGTGCAC CATGAGCACG 
AATCCTAAAC CTCAAAGAAA AACCAAAGGG CGCGCCATGA TTGAACAAGA 
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TGGATTGCAC GCAGGTTCTC CGGCCGCTTG GGTGGAGAGG CTATTCGGCT 


450 


5 


ATGACTGGGC ACAACAGACA ATCGGCTGCT CTGATGCCGC CGTGTTCCGG 


500 




CTGTCAGCGC AGGGGCGCCC GGTTCTTTTT GTCAAGACCG ACCTGTCCGG 


55 0 




TGCCCTGAAT GAAC TGCAGG ACGAGGCAGC GCGGCTATCG TGGCTGGCCA 


600 


10 


CGACGGGCGT TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC TGAAGCGGGA 


650 




AGGGACTGGC TGCTATTGGG CGAAGTGCCG GGGCAGGATC TCCTGTCATC 


700 


15 


TCACCTTGCT CCTGCCGAGA AAGTATCCAT CATGGCTGAT GCAATGCGGC 


750 




GGCTGCATAC GCTTGATCCG GCTACCTGCC CATTCGACCA CCAAGCGAAA 


800 

U V V 


20 


CATCGCATCG AGCGAGCACG TACTCGGATG GAAGCCGGTC TTGTCGATCA 


<J -J w 




GGATGATCTG GACGAAGAGC ATCAGGGGCT CGCGCCAGCC GAACTGTTCG 




25 


CCAGGCTCAA GGCGCGCATG CCCGACGGCG AGGATCTCGT CGTGACCCAT 


950 
^ *j \j 


GGCGATGCCT GCTTGCCGAA TATCATGGTG GAAAATGGCC GCTTTTCTGG 


1 000 

J. Ul/u 




ATTCATCGAC TGTGGCCGGC TGGGTGTGGC GGACCGCTAT CAGGACATAG 




30 


CGTTGGCTAC CCGTGATATT GCTGAAGAGC TTGGCGGCGA ATGGGCTGAC 


1 1 nn 




CGCTTCCTCG TGCTTTACGG TATCGCCGCT CCCGATTCGC AGCGCATCGC 


1 1 

IIjU 


35 


CTTCTATCGC CTTCTTGACG AGTTCTTCTG AGTTTAAACA GACCACAACG 


i onn 




GTTTCCCTCT AGCGGGATCA ATTCCGCCCC TCTCCCTCCC CCCCCCCTAA 


1ZDU 


40 


CGTTACTGGC CGAAGCCGCT TGGAATAAGG CCGGTGTGCG TTTGTCTATA 






TGTTATTTTC CACCATATTG CCGTCTTTTG GCAATGTGAG GGCCCGGAAA 




45 


CCTGGCCCTG TCTTCTTGAC GAGCATTCCT AGGGGTCTTT CCCCTCTCGC 


i 4 on 


CAAAGGAATG CAAGGTCTGT TGAATGTCGT GAAGGAAGCA GTTCCTCTGG 


1 /icn 




AAGCTTCTTG AAGACAAACA ACGTCTGTAG CGACCCTTTG CAGGCAGCGG 


iOUU 


50 


AACCCCCCAC CTGGCGACAG GTGCCTCTGC GGCCAAAAGC CACGTGTATA 


1 ccn 




AGATACACCT GCAAAGGCGG CACAACCCCA GTGCCACGTT GTGAGTTGGA 




55 


TAGTTGTGGA AAGAGTCAAA TGGCTCTCCT CAAGCGTATT CAACAAGGGG 


1650 




CTGAAGGATG CCCAGAAGGT ACCCCATTGT ATGGGATCTG ATCTGGGGCC 


i 7nn 


60 


TCGGTGCACA TGCTTTACAT GTGTTTAGTC GAffiTTaaaa aarrTr"rarr 


1750 




CCCCCCGAAC CACGGGGACG TGGTTTTCCT TTGAAAAACA CGATAATACC 


1800 


65 


ATGGCGCCTA TTACGGCCTA CTCCCAACAG ACGCGAGGCC TACTTGGCTG 


1850 


CATCATCACT AGCCTCACAG GCCGGGACAG GAAC C AGGTC GAGGGGGAGG 


1900 



38 



TCCAAGTGGT 
GGCGTGTGTT 
CCCAAAGGGC 
TCGGCTGGCA 
GGCAGCTCGG 
GCGCCGGCGG 
CCTACTTGAA 
GCTGTGGGCA 
GGTGGACTTT 
TCTTCACGGA 
GCCCATCTAC 
TGCGT AT GC A 
CCGCCACCCT 
CC TAACATC A 
GTACTCCACC 
CCTATGACAT 
ATCCTGGGCA 
ACTCGTCGTG 
ATCCAAACAT 
TATGGCAAAG 
TTTCTGCCAT 
GCCTCGGACT 
ATACCAACTA 
GGGCTTTACC 
CCCAGACAGT 
ACCGTGCCAC 
TAGGGGCAGG 
CGGGCATGTT 
GCTTGGTACG 
CCTAAACACA 
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CTCCACCGCA ACACAATCTT TCCTGGCGAjC CTGCGTCAAT 1950 

GG AC TGTCT A TCATGGTGCC GGCTCAAAGA CCCTTGCCGG 2000 

CCAATCACCC AAATGTACAC CAATGTGGAC CAGGACCTCG 2050 

AGCGCCCCCC GGGGCGCGTT CCTTGACACC ATGCACCTGC 2100 

ACCTTTACTT GGTCACGAGG CATGCCGATG TCATTCCGGT 2150 

GGCGACAGCA GGGGGAGCCT ACTCTCCCCC AGGCCCGTCT 2200 

GGGCTCTTCG GGCGGTCCAC TGCTCTGCCC CTCGGGGCAC 2250 

TCTTTCGGGC TGCCGTGTGC ACCCGAGGGG TTGCGAAGGC 2300 

GTACCCGTCG AGTCTATGGA AACCACTATG CGGTCCCCGG 2350 

CAACTCGTCC CCTCCGGCCG T ACC GC AG AC ATTCCAGGTG 2 400 

ACGCCCCTAC TGGTAGCGGC AAGAGCACTA AGGTGCCGGC 2450 

GCCCAAGGGT ATAAGGTGCT TGTCCTGAAC CCGTCCGTCG 25 00 

AGGTTTCGGG GCGTATATGT CTAAGGCACA TGGTATCGAC 2550 

GAACCGGGGT AAGGACCATC ACCACGGGTG CCCCCATCAC 2600 

TATGGCAAGT TTCTTGCCGA CGGTGGTTGC TCTGGGGGCG 2650 

CATAATATGT GATGAGTGCC ACTCAACTGA CTCGACCACT 2700 

TCGGCACAGT CCTGGACCAA GCGGAGACGG CTGGAGCGCG 2750 

CTCGCCACCG CTACGCCTCC GGGATCGGTC ACCGTGCCAC 2800 

CGAGGAGGTG GCTCTGTCCA GC ACT GG AG A AATCCCCTTT 2850 

CCATCCCCAT CGAGACCATC AAGGGGGGGA GGCACCTCAT 2900 

TCCAAGAAGA AATGTGATGA GCTCGCCGCG AAGCTGTCCG 2950 

CAATGCTGTA GC AT ATT ACC GGGGCCTTGA TGTATCCGTC 3000 

GCGGAGACGT CATTGTCGTA GCAACGGACG CTCTAATGAC 3050 

GGCGATTTCG ACTCAGTGAT CGACTGCAAT ACATGTGTCA 3100 

CGACTTCAGC CTGGACCCGA CCTTCACCAT TGAGACGACG 3150 

AAGACGCGGT GTCACGCTCG CAGCGGCGAG GCAGGACTGG 3200 

ATGGGCATTT ACAGGTTTGT GACTCCAGGA GAACGGCCCT 3250 

CGATTCCTCG GTTCTGTGCG AGTGCTATGA CGCGGGCTGT 3300 

AGCTCACGCC CGCCGAGACC TCAGTTAGGT TGCGGGCTTA 3350 

CCAGGGTTGC CCGTCTGCCA GGACCATCTG GAGTTCTGGG 34 00 
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AGAGCGTCTT 
ACTAAGCAGG 
GGTGTGCGCC 
AGTGTCTCAT 
TATAGGCTGG 
CAAATACATC 
CCTGGGTGCT 
ACAACAGGCA 
GGCCATCATT 
AAGAGTGCGC 
GAACAATTCA 
AGCGGAGGCT 
CCTTCTGGGC 
GCAGGCTTGT 
ATTCACAGCC 
TTAACATCCT 
GCTTCTGCTT 
AGGCCTTGGG 
TGGCAGGCGC 
ACCGAGGACC 
AGTCGTCGGG 
GGGAGGGGGC 
GGTAACCACG 
ACGTGTCACT 
GGCTTCACCA 
TGGCTAAGAG 
GACCTGGCTC 
TCTCATGTCA 
CAAACCACCT 
TTCCATGAGG 



TACAGGCCTC 
CAGGAGACAA 
AGGGCTCAGG 
ACGGCTAAAG 
GAGCCGTTCA 
ATGGCATGCA 
GGTAGGCGGA 
GCGTGGTCAT 
CCCGACAGGG 
CTCACACCTC 
AACAGAAGGC 
GCTGCTCCCG 
GAAGCATATG 
CCACTCTGCC 
TCTATCACCA 
GGGGGGATGG 
TCGTAGGCGC 
AAGGTGCTTG 
GCTCGTGGCC 
TGGTTAACCT 
GTCGTGTGCG 
TGTGCAGTGG 
TCTCCCCCAC 
CAGATCCTCT 
GTGGATCAAC 
ATGTTTGGGA 
CAGTCCAAGC 
ACGTGGGTAC 
GCCCATGTGG 
ATCGTGGGGC 
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ACCCACATAG ACGCCCATTT CTTGTCCCAG 3450 

CTTCCCCTAC CTGGTAGCAT ACCAGGCTAC 3500 

CTCCACCTCC ATCGTGGGAC CAAATGTGGA 3550 

CCTACGCTGC ACGGGCCAAC GCCCCTGCTG 3600 

AAACGAGGTT ACTACCACAC ACCCCATAAC 3650 

TGTCGGCTGA CCTGGAGGTC GTCACGAGCA 3700 

GTCCTAGCAG CTCTGGCCGC GTATTGCCTG 37 50 

TGTGGGCAGG ATCATCTTGT CCGGAAAGCC 3800 

AAGTCCTTTA CCGGGAGTTC GATGAGATGG 3850 

CCTTACATCG AACAGGGAAT GCAGCTCGCC 3900 

AATCGGGTTG CTGCAAACAG CCACCAAGCA 3950 

TGGTGGAATC CAAGTGGCGG ACCCTCGAAG 4000 

TGGAATTTCA T C AGCGGG AT ACAATATTTA 4050 

TGGCAACCCC GCGATAGCAT CACTGATGGC 4100 

GCCCGCTCAC CACCCAACAT ACCCTCCTGT 4150 

GTGGCCGCCC AACTTGCTCC TCCCAGCGCT 4200 

CGGCATCGCT GGAGCGGCTG TTGGCAGCAT 4250 

TGGATATTTT GGCAGGTTAT GGAGCAGGGG 4300 

TTTAAGGTCA T G AGCGGCG A GATGCCCTCC 4350 

ACTCCCTGCT ATCCTCTCCC CTGGCGCCCT 4 4 00 

CAGCGATACT GCGTCGGCAC GTGGGCCCAG 4450 

ATGAACCGGC TGATAGCGTT CGCTTCGCGG 4500 

GCACTATGTG CCTGAGAGCG ACGCTGCAGC 4550 

CTAGTCTTAC CATC ACT C AG CTGCTGAAGA 4 600 

GAGGACTGCT CCACGCCATG CTCCGGCTCG 4 650 

TTGGATATGC ACGGTGTTGA CTGATTTCAA 4700 

TCCTGCCGCG ATTGCCGGGA GTCCCCTTCT 4750 

AAGGGAGTCT GGCGGGGCGA CGGCATCATG 4800 

AGCACAGATC ACCGGACATG TGAAAAAC GG 4 850 

CTAGGACCTG TAGTAACACG TGGCATGGAA 4 900 



40 



CATTCCCCAT 
CCAAATTATT 
GGTTACGCGG 
ACGTAAAGTG 
GATGGGGTGC 
GGAGGAGGTC 
AGCTCCCATG 
ACCGACCCCT 
GGGATCTCCC 
CTTCCTTGAA 
CTCATCGAGG 
CCGCGTGGAG 
TCCAAGCGGA 
CGGAGGTCCA 
TTACAACCCT 
CAGTGGTACA 
CCTCCACGGA 
TGCC T TGGCG 
CCGTCGACAG 
GGCGACGCGG 
GGGGGAGCCG 
GCGAGGAGGC 
ACAGGCGCCC 
CAATGCACTG 
CAACATCTCG 
CTGCAGGTCC 
GAAGGCGTCC 
AGCTGACGCC 
GACGTCCGGA 
GAAGGACTTG 
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TAACGCGTAC ACCACGGGCC CCTGCACGCC CTCCCCGGCG 4 950 

CTAGGGCGCT GTGGCGGGTG GCTGCTGAGG AGTACGTGGA 5000 

GTGGGGGATT TCCACTACGT GACGGGCATG ACCACTGACA 5050 

CCCGTGTCAG GTTCCGGCCC CCGAATTCTT CACAGAAGTG 5100 

GGTTGCACAG GTACGCTCCA GCGTGCAAAC CCCTCCTACG 5150 

ACATTCCTGG TCGGGCTCAA TCAATACCTG GTTGGGTCAC 5200 

CGAGCCCGAA CCGGACGTAG CAGTGCTCAC TTCCATGCTC 5250 

CCCACATTAC GGCGGAGACG GCTAAGCGTA GGCTGGCCAG 5300 

CCCTCCTTGG CCAGCTCATC AGCTAGCCAG CTGTCTGCGC 5350 

GGCAACATGC ACTACCCGTC ATGACTCCCC GGACGC TG AC 5400 

CCAACCTCCT GTGGCGGCAG GAGATGGGCG GGAACATCAC 54 50 

TCAGAAAATA AGGTAGTAAT TTTGGACTCT TTCGAGCCGC 5500 

GGAGGATGAG AGGGAAGTAT CCGTTCCGGC GGAGATCCTG 5550 

GGAAATTCCC TCGAGCGATG CCCATATGGG CACGCCCGGA 5600 

C C AC T GTTAG AGTCCTGGAA GGACCCGGAC TACGTCCCTC 5650 

CGGGTGTCCA TTGCCGCCTG CCAAGGCCCC TCCGATACCA 5700 

GGAAGAGGAC GGTTGTCCTG TCAGAATCTA CCGTGTCTTC 5750 

GAGCTCGCCA CAAAGACCTT CGGCAGCTCC GAATCGTCGG 5800 

CGGCACGGCA ACGGCCTCTC CTGACCAGCC CTCCGACGAC 5850 

GATCCGACGT TGAGTCGTAC TCCTCCATGC CCCCCCTTGA 5 900 

GGGGATCCCG ATCTCAGCGA CGGGTCTTGG TCTACCGTAA 5950 

TAGTGAGGAC GTCGTCTGCT GCTCGATGTC CT AC AC AT GG 6000 

TGATCACGCC ATGCGCTGCG GAGGAAACCA AGCTGCCCAT 6050 

AGCAACTCTT TGCTCCGTCA CCACAACTTG GTCTATGCTA 6100 

CAGCGCAAGC CTGCGGCAGA AGAAGGTCAC CTTTGACAGA 6150 

TGGACGACCA CTACCGGGAC GTGCTCAAGG AGATGAAGGC 6200 

ACAGTTAAGG CTAAACTTCT ATCCGTGGAG GAAGCCTGTA 6250 

CCCACATTCG GCCAGATCTA AATTTGGCTA TGGGGCAAAG 6300 

ACCTAT CCAG CAAGGCCGTT AACCACATCC GCTCCGTGTG 6350 

CTGGAAGACA CTGAGACACC AATTGACACC ACCATCATGG 6400 
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CAAAAAATGA 


GGTTTTCTGC 


GTCCAACCAG 


AGAAGGGGGG 


CCGCAAGCCA 


6450 




GCTCGCCTTA 


TCGTATTCCC 


AGATTTGGGG 


GTTCGTGTGT 


GCGAGAAAAT 


6500 


5 


GGCCCTTTAC 


GATGTGGTCT 


CCACCCTCCC 


TCAGGCCGTG 


ATGGGCTCTT 


6550 




CATACGGATT 


CCAATACTCT 


CCTGGACAGC 


GGGTCGAGTT 


CCTGGTGAAT 


6600 


10 


GCCT GGAAAG 


CGAAGAAATG 


CCCTATGGGC 


TTCGCATATG 


ACACCCGCTG 


6650 




TTTTGACTCA 


ACGGTCACTG 


AGAATGACAT 


CCGTGTTGAG 


GAGTCAATCT 


6700 


15 


ACCAATGTTG 


TGACTTGGCC 


CCCGAAGCCA 


GACAGGCCAT 


AAGGTCGCTC 


6750 




ACAGAGCGGC 


TTTACATCGG 


GGGCCCCCTG 


ACTAATTCTA 


AAGGGCAGAA 


6800 


20 


CTGCGGCTAT 


CGCCGGTGCC 


GCGCGAGCGG 


TGTACTGACG 


ACCAGCTGCG 


6850 




GTAATACCCT 


CACATGTTAC 


TTGAAGGCCG 


CTGCGGCCTG 


TCGAGCTGCG 


6900 


25 


AAGCTCCAGG 


ACTGCACGAT 


GCTCGTATGC 


GGAGACGACC 


TTGTCGTTAT 


6Qsn 

vJ Z* \J 


CTGTGAAAGC 


GC GGGGACC C 


AAGAGGACGA 


GGCGAGCCTA 




7 nnn 




CGGAGGCTAT 


GACTAGATAC 


TCTGCCCCCC 


CTGGGGACCC 


GCCCAAACCA 


# w ^ \j 


30 


GAATACGACT 


TGGAGTTGAT 


AACATCATGC 


TCCTCCAATG 


TGTCAGTCGC 


71 on 




GCACGATGCA 


TCTGGCAAAA 


GGGTGTACTA 


TCTCACCCGT 


GACCCCACCA 


71 SO 


35 


CCCCCCTTGC 


GCGGGCTGCG 


TGGGAGACAG 


CTAGACACAC 


TCCAGTCAAT 


7 9 nn 

/ £- \J\J 




TCCTGGCTAG 


GC AAC AT CAT 


CATGTATGCG 


CCCACCTTGT 


GGGCAAGGAT 


79 sn 


40 


GATCCTGATG 


ACTCATTTCT 


TCTCCATCCT 


TCTAGCTCAG 


uruiv^xviv^ x x w 


7 *3nn 




AAAAAGCCCT 


AGATTGTCAG 


AT CT ACGGGG 


CCTGTTACTC 


c attg A^rr a 


/ J o u 


45 


CTTGACCTAC 


CTCAGATCAT 


TCAACGACTC 


CATGGCCTTA 


GCGCATTTTC 


7 4 nn 


ACTCCATAGT 


TACTCTCCAG 


GTGAGATCAA 


T AGGGT GGCT 


TCATGCCTCA 


74 




GGAAACTTGG 


GGTACCGCCC 


TTGCGAGTCT 


GGAGACATCG 


GGCCAGAAGT 


7 snn 
/ ~j \j \j 


50 


GTCCGCGCTA 


GGCTACTGTC 


CCAGGGGGGG 


AGGGCTGCCA 


CTTGTGGPAA 


7 s ^n 

/ +J *J u 




GTACCTCTTC 


AACTGGGCAG 


TAAGGACCAA 


GCTCAAACTC 


ACTCCAATPP 


7 finn 




CGGCTGCGTC 


CCAGT TGGAT 


TTATCCAGCT 


GGTTCGTTGC 


TGGTTACAGf 


76sn 




GGGGGAGACA 


TATATCACAG 


CCTGTCTCGT 


GCCCGACCCC 


GCTGGTTCAT 

Wv » X VJVJ X X V^XTLX 


77nn 


60 




U 1 1 ACTTT 


CTGTAGGGGT 


AGGCATCTAT 


CTACTCCCCA 


7750 


ACCGATGAAC 


GGGGAGCTAA 


ACACTCCAGG 


CCAATAGGCC 


ATCCTGTTTT 


7800 




TTTCCCTTTT 


TTTTTTTCTT 


TTTTTTTTTT 


T TT T* T T T T T 


TTTTTTTTTT 


7850 


65 


TTCTCCTTTT 


TTTTTCCTCT 


TTTTTTCCTT 


TTCTTTCCTT 


TGGTGGCTCC 


7900 
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ATCTTAGCCC TAGTCACGGC TAGCTGTGAA AGGTCCGTGA GCCGCTTGAC 7950 
TGCAGAGAGT GCTGATACTG GCCTCTCTGC AGATCAAGT 
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ANGABEN ZU SEQ ID-NO: 5 : 

5 SEQUENZCHARAKTERJSTIKA: 
LANGE: 8649 Basenpaare 
ART: NukJeinsaure 
STRANGFORM: Einzelstrang 
10 TOPOLOGIE: linear 

ART DES MOLEKULS: Subgenom-RNA 

is HYPOTHETISCH: Nein 

ANTI-SENSE: nein 

20 URSPRUNGLICHE HERKUNFT: 

ORGAN! SMUS: Hepatitis C Virus 

STAMM: Genotyp lb 
25 ENTWICKLUNGSSTADIUM: — 

ZELLTYP: — 

UNMITTELBARE HERKUNFT: 
30 Isolat aus humanen Leberzellen 

MERKMAL: 

NAME/SCHLUS SEL: kodierende Sequenz fur Virusproteine 
35 LAGE: — 

ERMITTLUNGSMETHODE: . experimentell 
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SEQUENZBESCHREIBUNG: SEQ ID-NO: 5 
I 3 e 9 /NS2-3'/wt: 8649 bp 

GCCAGCCCCC GATTGGGGGC GACACTCCAC CATAGATCAC TCCCCTGTGA 50 

GGAACTACTG TCTTCACGCA GAAAGCGTCT AGCCATGGCG TTAGTATGAG 100 

TGTCGTGCAG CCTCCAGGAC CCCCCCTCCC GGGAGAGCCA TAGTGGTCTG 150 

CGGAACCGGT GAGTACACCG GAATTGCCAG GACGACCGGG TCCTTTCTTG 200 

GATCAACCCG CTCAATGCCT GGAGATTTGG GCGTGCCCCC GCGAGACTGC 250 

TAGCCGAGTA GTGTTGGGTC GCGAAAGGCC TTGTGGTACT GCCTGATAGG 300 

GTGCTTGCGA GTGCCCCGGG AGGTCTCGTA GACCGTGCAC CATGAGCACG 350 

AATCCTAAAC CTCAAAGAAA AACCAAACGT AACACCAACG GGCGCGCCAT 400 
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GATTGAACAA 
GGCTATTCGG 
GCCGTGTTCC 
CGACCTGTCC 
CGTGGCTGGC 
ACTGAAGCGG 
TCTCCTGTCA 
ATGCAATGCG 
CACCAAGCGA 
TCTTGTCGAT 
CCGAACTGTT 
GTCGTGACCC 
CCGCTTTTCT 
AT C AGG AC AT 
GAATGGGCTG 
GCAGCGCATC 
CAGACCACAA 
CCCCCCCCCT 
CGTTTGTCTA 
TkGGGCCCGGA 
TTCCCCTCTC 
CAGTTCCTCT 
TGCAGGCAGC 
GCCACGTGTA 
TTGTGAGTTG 
TTCAACAAGG 
TGATCTGGGG 
AAAACGTCTA 
CACGATAATA 
TTTCGTAGGT 



DE 199 15 178 A 1 

GATGGATTGC ACGCAGGTTC TCCGGCCGCT TGGGTGGAGA 450 

CTATGACTGG GCACAACAGA CAATCGGCTG CTCTGATGCC 500 

GGCTGTCAGC GCAGGGGCGC CCGGTTCTTT TTGTCAAGAC 550 

GGTGCCCTGA ATGAACTGCA GGACGAGGCA GCGCGGCTAT 600 

CACGACGGGC GTTCCTTGCG CAGCTGTGCT CGACGTTGTC 650 

GAAGGGACTG GCTGCTATTG GGCGAAGTGC C GGGGC AGG A 700 

TCTCACCTTG CTCCTGCCGA GAAAGTATCC ATCATGGCTG 750 

GCGGCTGCAT ACGCTTGATC CGGCTACCTG CCCATTCGAC 800 

AACATCGCAT CGAGCGAGCA CGTACTCGGA TGGAAGCCGG 850 

CAGGATGATC TGGACGAA^A GCATCAGGGG CTCGCGCCAG 900 

CGCCAGGCTC AAGGCGCGCA TGCCCGACGG CGAGGATCTC 950 

ATGGCGATGC CTGCTTGCCG AATATCATGG TGGAAAATGG 1000 

GGATTCATCG ACTGTGGCCG GCTGGGTGTG GCGGACCGCT 1050 

AGCGTTGGCT ACCCGTGATA TTGCTGAAGA GCTTGGCGGC 1100 

ACCGCTTCCT CGTGCTTTAC GGTATCGCCG CTCCCGATTC 1150 

GCCTTCTATC GCCTTCTTGA CGAGTTCTTC TGAGTTTAAA 1200 

CGGTTTCCCT CTAGCGGGAT CAATTCCGCC CCTCTCCCTC 1250 

AACGTTACTG GCCGAAGCCG CTTGGAATAA GGCCGGTGTG 1300 

TATGTTATTT TCCACCATAT TGCCGTCTTT TGGCAATGTG 1350 

AACCTGGCCC TGTCTTCTTG ACGAGCATTC CTAGGGGTCT 1400 

GCCAAAGGAA TGCAAGGTCT GTTGAATGTC GTGAAGGAAG 1450 

GGAAGCTTCT T G AAGAC AAA CAACGTCTGT AGCGACCCTT 1500 

GGAACCCCCC ACCTGGCGAC AGGTGCCTCT GCGGCCAAAA 1550 

TAAGATACAC CTGCAAAGGC GGCACAACCC CAGTGCCACG 1600 

GATAGTTGTG GAAAGAGTCA AATGGCTCTC CTCAAGCGTA 1650 

GGCTGAAGGA TGCCCAGAAG GTACCCCATT GTATGGGATC 1700 

CCTCGGTGCA CATGCTTTAC ATGTGTTTAG TCGAGGTTAA 1750 

GGCCCCCCGA ACCACGGGGA CGTGGTTTTC CTTTGAAAAA 1800 

CCATGGACCG GGAGATGGCA GCATCGTGCG GAGGCGCGGT 1850 

CTGATACTCT TGACCTTGTC ACCGCACTAT AAGCTGTTCC 1900 
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TCGCTAGGCT 


CATATGGTGG 


TTACAATATT 


TTATCACCAG 


GGCCGAGGCA 


- 1950 




CACTTGCAAG 


! TGTGGATCCC 


CCCCCTCAAC 


GTTCGGGGGG 


GCCGCGATGC 


2000 


5 


CGTCATCCTC 


CTCACGTGCG 


CGATCCACCC 


AGAGCTAATC 


TTTACCATCA 


2050 




CCAAAATCTT 


GCTCGCCATA 


CTCGGTCCAC 


TCATGGTGCT 


CCAGGCTGGT 


2100 


10 


ATAACCAAAG 


TGCCGTACTT 


CGTGCGCGCA 


CACGGGCTCA 


TTCGTGCATG 


2150 




CATGCTGGTG 


CGGAAGGTTG 


CTGGGGGTCA 


TTATGTCCAA 


ATGGCTCTCA 


2200 


15 


TGAAGTTGGC 


CGCACTGACA 


GGTACGTACG 


TTTATGACCA 


TCTCACCCCA 


2250 




CTGCGGGACT 


GGGCCCACGC 


GGGCCTACGA 


GACCTTGCGG 


TGGCAGTTGA 


2300 


20 


GCCCGTCGTC 


TTCTCTGATA 


TGGAGACCAA 


GGTTATCACC 


TGGGGGGCAG 


2350 




ACACCGCGGC 


GTGTGGGGAC 


ATCATCTTGG 


GCCTGCCCGT 


CTCCGCCCGC 


2400 


25 


AGGGGGAGGG 


AGATACATCT 


GGGACCGGCA 


GACAGCCTTG 


AAGGGCAGGG 


2450 


GTGGCGACTC 


CTCGCGCCTA 


TTACGGCCTA 


CTCCCAACAG 


ACGCGAGGCC 


2500 




TACTTGGCTG 


CATCATCACT 


AGCCTCACAG 


GCCGGGACAG 


GAACCAGGTC 


2550 


30 


GAGGGGGAGG 


TCCAAGTGGT 


CTCCACCGCA 


ACACAATCTT 


TCCTGGCGAC 


2600 




CTGCGTCAAT 


GGCGTGTGTT 


GGACTGTCTA 


TCATGGTGCC 


GGCTCAAAGA 


2650 


35 


CCCTTGCCGG 


CCCAAAGGGC 


CCAATCACCC 


AAATGTACAC 


CAATGTGGAC 


2700 




CAGGACCTCG 


TCGGCTGGCA 


AGCGCCCCCC 


GGGGCGCGTT 


CCTTGACACC 


2750 


40 


ATGCACCTGC 


GGCAGCTCGG 


ACCTTTACTT 


GGTCACGAGG 


CATGCCGATG 


2800 




TCATTCCGGT 


GCGCCGGCGG 


GGCGACAGCA 


GGGGGAGCCT 


ACTCTCCCCC 


2850 


45 


AGGCCCGTCT 


CCTACTTGAA 


GGGCTCTTCG 


GGCGGTCCAC 


TGCTCTGCCC 


2900 


C TCGGGGC AC 


GCTGTGGGCA 


TCTTTCGGGC 


TGCCGTGTGC 


ACCCGAGGGG 


£- «7 \J 




TTGCGAAGGC 


GGTGGACTTT 


GT AC CCGTCG 


AGTCTATGGA 


AACCACTATG 


3000 


50 


CGGTCCCCGG 


TCTTCACGGA 


CAACTCGTCC 


CCTCCGGCCG 


TACCGCAGAC 


3050 




ATTCCAGGTG 


GCCCATCTAC 


ACGCCCCTAC 


TGGTAGCGGC 


AAGAGCACTA 


3100 


55 


AGGTGCCGGC 


TGCGTATGCA 


GCCCAAGGGT 


ATAAGGTGCT 


TGTCCTGAAC 


3150 




CCGTCCGTCG 


CCGCCACCCT 


AGGTTTCGGG 


GCGTATATGT 


CTAAGGCACA 


3200 


60 








AAGGACCATC 


ACCACGGGTG 


3250 




CCCCCATCAC 


GTACTCCACC 


TATGGCAAGT 


TTCTTGCCGA 


CGGTGGTTGC 


3300 




TCTGGGGGCG 


CCTATGACAT 


CATAATATGT 


GAT GAGTGCC 


ACTCAACTGA 


3350 


65 


CTCGACCACT . 


ATCCTGGGCA 


TCGGCACAGT 


CCTGGACCAA 


GCGGAGACGG 


3400 
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CTGGAGCGCG ACTCGTCGTG CTCGCCACCG CTACGCCTCC GGGATCGGTC 34 50 

ACCGTGCCAC ATCCAAACAT CGAGGAGGTG GCTCTGTCCA GCACTGGAGA 3500 

AATCCCCTTT TATGGCAAAG CCATCCCCAT CGAGACCATC AAGGGGGGGA 3550 

GGCACCTCAT TTTCTGCCAT TCCAAGAAGA AATGTGATGA GCTCGCCGCG 3600 

AAGCTGTCCG GCCTCGGACT CAATGCTGTA GCATATTACC GGGGCCTTGA 3650 

TGTATCCGTC ATACCAACTA GCGGAGACGT CATTGTCGTA GCAACGGACG 3700 

CTCTAATGAC GGGCTTTACC GGCGATTTCG ACTCAGTGAT CGACTGCAAT 3750 

ACATGTGTCA CCCAGACAGT CG ACT TCAGC CTGGACCCGA CCTTCACCAT 3800 

TGAGACGACG ACCGTGCCAC AAGACGCGGT GTCACGCTCG CAGCGGCGAG 3850 

GCAGGACTGG TAGGGGCAGG ATGGGCATTT ACAGGTTTGT GACTCCAGGA 3900 

GAACGGCCCT CGGGCATGTT CGATTCCTCG GTTCTGTGCG AGTGCTATGA 3950 

CGCGGGCTGT GCTTGGTACG AGCTCACGCC CGCCGAGACC TCAGTTAGGT 4000 

TGCGGGCTTA CCTAAACACA CCAGGGTTGC CCGTCTGCCA GGACCATCTG 4050 

GAGTTCTGGG AGAGCGTCTT TACAGGCCTC ACCCACATAG ACGCCCATTT 4100 

CTTGTCCCAG ACTAAGCAGG CAGGAGACAA CTTCCCCTAC CTGGTAGCAT 4150 

ACCAGGCTAC GGTGTGCGCC AGGGCTCAGG CTCCACCTCC ATCGTGGGAC 4200 

CAAATGTGGA AGTGTCTCAT ACGGCTAAAG CCTACGCTGC ACGGGCCAAC 4250 

GCCCCTGCTG TATAGGCTGG GAGCCGTTCA AAACGAGGTT ACTACCACAC 4300 

ACCCCATAAC CAAATACATC ATGGC AT GC A TGTCGGCTGA CCTGGAGGTC 4 350 

GTCACGAGCA CCTGGGTGCT GGTAGGCGGA GTCCTAGCAG CTCTGGCCGC 4400 

GTATTGCCTG ACAACAGGCA GCGTGGTCAT TGTGGGCAGG ATCATCTTGT 4450 

CCGGAAAGCC GGCC AT CAT T CCCGACAGGG AAGTCCTTTA CCGGGAGTTC 4 500 

GATGAGATGG AAGAGTGCGC CTCACACCTC CCTTACATCG AACAGGGAAT 4550 

GCAGCTCGCC GAACAATTCA AACAGAAGGC AATCGGGTTG CTGCAAACAG 4 600 

CCACCAAGCA AGCGGAGGCT GCTGCTCCCG TGGTGGAATC CAAGTGGCGG 4 650 

ACCCTCGAAG CCTTCTGGGC G AAGC AT AT G TGGAATTTCA TCAGCGGGAT 4700 

ACAATATTTA GCAGGCTTGT CCACTCTGCC TGGCAACCCC GCGATAGCAT 4750 

C AC TGATGGC ATTCACAGCC TCTATCACCA GCCCGCTCAC CACCCAACAT 4800 

ACCCTCCTGT TTAACATCCT GGGGGGATGG GTGGCCGCCC AACTTGCTCC 4 850 

TCCCAGCGCT GCTTCTGCTT TCGTAGGCGC CGGCATCGCT GGAGCGGCTG 4 900 
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TTGGCAGCAT AGGCCTTGGG AAGGTGCTTG TGGATATTTT GGCAGGTTAT 4 950 

GGAGCAGGGG TGGCAGGCGC GCTCGTGGCC TTTAAGGTCA TGAGCGGCGA 5000 

5 

GATGCCCTCC ACCGAGGACC TGGTTAACCT ACTCCCTGCT ATCCTCTCCC 5050 

CTGGCGCCCT AGTCG TCGGG GTCGTGTGCG CAGCGATACT GCGTCGGCAC 5100 

10 GTGGGCCCAG GGGAGGGGGC TGTGCAGTGG ATGAACCGGC TGATAGCGTT 5150 

CGCTTCGCGG GGTAACCACG TCTCCCCCAC GCACTATGTG CCTGAGAGCG 5200 

15 ACGCTGCAGC ACGTGTCACT CAGATCCTCT CTAGTCTTAC CATCACTCAG 5250 

CTGCTGAAGA GGCTTCACCA GTGGATCAAC GAGGACTGCT CCACGCCATG 5300 

2Q CTCCGGCTCG TGGCTAAGAG ATGTTTGGGA TTGGATATGC ACGGTGTTGA 5350 

CTGATTTCAA GACCTGGCTC CAGTCCAAGC TCCTGCCGCG ATTGCCGGGA 5400 

GTCCCCTTCT TCTCATGTCA ACGTGGGTAC AAGGGAGTCT GGCGGGGCGA 5450 

25 

CGGCATCATG CAAACCACCT GCCCATGTGG AGCACAGATC ACCGGACATG 5500 

TGAAAAACGG TTCCATGAGG ATCGTGGGGC CTAGGACCTG TAGTAACACG 5550 

30 ~ 

TGGCATGGAA CATTCCCCAT TAACGCGTAC ACCACGGGCC CCTGCACGCC 5600 

CTCCCCGGCG CCAAATTATT CTAGGGCGCT GTGGCGGGTG GCTGCTGAGG 5650 

35 AGTACGTGGA GGTTAC GCGG GTGGGGGATT TCCACTACGT GACGGGCATG 5700 

ACCACTGACA ACGTAAAGTG CCCGTGTCAG GTTCCGGCCC CCGAATTCTT 5750 

4Q CACAGAAGTG GATGGGGTGC GGTTGCACAG GTACGCTCCA GCGTGCAAAC 5800 

CCCTCCTACG GGAGGAGGTC ACATTCCTGG TCGGGCTCAA TCAATACCTG 5850 

GTTGGGTCAC AGCTCCCATG CGAGCCCGAA CCGGACGTAG CAGTGCTCAC 5900 

45 

TTCCATGCTC ACCGACCCCT CCCACATTAC GGCGGAGACG GCTAAGCGTA 5950 

GGCTGGCCAG GGGATCTCCC CCCTCCTTGG CCAGCTCATC AGCTAGCCAG 6000 

50 CTGTCTGCGC CTTCCTTGAA GGCAACATGC ACTACCCGTC ATGACTCCCC 6050 

GGACGCTGAC CTCATCGAGG CCAACCTCCT GTGGCGGCAG GAGATGGGCG 6100 

S5 GGAACATCAC CCGCGTGGAG TCAGAAAATA AGGTAGTAAT TTTGGACTCT 6150 

TTCGAGCCGC TCCAAGCGGA GGAGGATGAG AGGGAAGTAT CCGTTCCGGC 6200 

GGAGAT CCTG CGGAGGTCCA GGAAATTCCC TCGAGCGATG CCCATATGGG 6250 

60 

CACGCCCGGA TTACAACCCT CCACTGTTAG AGTCCTGGAA GGACCCGGAC 6300 

TACGTCCCTC CAGTGGTACA CGGGTGTCCA TTGCCGCCTG CCAAGGCCCC 6350 

65 

TCCGATACCA CCTCCACGGA GGAAGAGGAC GGTTGTCCTG TCAGAATCTA 6400 
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CCGTGTCTTC 
GAATCGTCGG 
CTCCGACGAC 
CCCCCCTTGA 
TCTACCGTAA 
CTACACATGG 
AGCTGCCCAT 
GTCTATGCTA 
CTTTGACAGA 
AGATGAAGGC 
GAAGCCTGTA 
TGGGGCAAAG 
GCTCCGTGTG 
ACCATCATGG 
CCGCAAGCCA 
GCGAGAAAAT 
ATGGGCTCTT 
CCTGGTGAAT 
ACACCCGCTG 
GAGTCAATCT 
AAGGTCGCTC 
AAGGGCAGAA 
ACCAGCTGCG 
TCGAGCTGCG 
TTGTCGTTAT 
CGGGCCTTCA 
GCCCAAACCA 
TGTCAGTCGC 
GACCCCACCA 
TCCAGTCAAT 
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TGCCTTGGCG GAGCTCGCCA CAAAGACCTT CGGCAGCTCC 6450 

CCGTCGACAG CGGCACGGCA ACGGCCTCTC CTGACCAGCC 6500 

GGCGACGCGG GATCCGACGT TGAGTCGTAC TCCTCCATGC 6550 

GGGGGAGCCG GGGGATCCCG ATCTCAGCGA CGGGTCTTGG 6600 

GCGAGGAGGC TAGTGAGGAC GTCGTCTGCT GCTCGATGTC 6650 

ACAGGCGCCC TGATCACGCC ATGCGCTGCG GAGGAAACCA 6700 

CAATGCACTG AGCAACTCTT TGCTCCGTCA CCACAACTTG 6750 

CAACATCTCG CAGCGCAAGC CTGCGGCAGA AGAAGGTCAC 6800 

CTGCAGGTCC TGGACGACCA CTACCGGGAC GTGCTCAAGG 6850 

GAAGGCGTCC ACAGTTAAGG CTAAACTTCT ATCCGTGGAG 6900 

AGCTGACGCC CCCACATTCG GCCAGATCTA AATTTGGCTA 6950 

GACGTCCGGA ACCTATCCAG CAAGGCCGTT AACCACATCC 7000 

GAAGGACTTG CTGGAAGACA CTGAGACACC AATTGACACC 7050 

CAAAAAATGA GGTTTTCTGC GTCCAACCAG AGAAGGGGGG 7100 

GCTCGCCTTA TCGTATTCCC AGATTTGGGG GTTCGTGTGT 7150 

GGCCCTTTAC GATGTGGTCT CCACCCTCCC TCAGGCCGTG 7200 

CATACGGATT CCAATACTCT CCTGGACAGC GGGTCGAGTT 7250 

GCCTGGAAAG CGAAGAAATG CCCTATGGGC TTCGCATATG 7300 

TTTTGACTCA ACGGTCACTG AGAATGACAT CCGTGTTGAG 7350 

ACCAATGTTG TGACTTGGCC CCCGAAGCCA GACAGGCCAT 7 400 

ACAGAGCGGC TTTACATCGG GGGCCCCCTG ACTAATTCTA 7 450 

CTGCGGCTAT CGCCGGTGCC GCGCGAGCGG TGTACTGACG 7500 

GTAATACCCT CACATGTTAC TTGAAGGCCG CTGCGGCCTG 7550 

AAGCTCCAGG ACTGCACGAT GCTCGTATGC GGAGAC GACC 7 600 

CTGTGAAAGC GCGGGGACCC AAGAGGACGA GGCGAGC C T A 7 650 

CGGAGGCTAT GACTAGATAC TCTGCCCCCC CTGGGGACCC 7700 

GAAT AC GACT TGGAGTTGAT AACATCATGC TCCTCCAATG 7750 

GCACGATGCA TCTGGCAAAA GGGTGTACTA TCTCACCCGT 7 800 

CCCCCCTTGC GCGGGCTGCG TGGGAGACAG CTAGACACAC 7850 

TCCTGGCTAG GCAACATCAT CATGTATGCG CCCACCTTGT 7900 
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GGGCAAGGAT 


G ATCCTG AT G ACTCATTTCT 


TCTCCATCCT 


TCTAGCTCAG 


7950 


GAACAACTTG 


AAAAAGCCCT 


AGATTGTCAG 


ATCTACGGGG 


CCTGTTACTC 


8000 


CATTGAGCCA 


CTTGACCTAC 


C TCAGATC AT 


TCAACGACTC 


CATGGCCTTA 


8'050 


GCGCATTTTC 


ACTCCATAGT 


TACTCTCCAG 


GTGAGATCAA 


TAGGGTGGCT 


8100 


TCATGCCrCA 


GGAAACTTGG 


GGTACCGCCC 


TTGCGAGTCT 


GGAGACATCG 


8150 


GGCCAGAAGT 


GTCCGCGCTA 


GGCTACTGTC 


CCAGGGGGGG 


AGGGCTGCCA 


8200 


CTTGTGGCAA 


GTACCTCTTC 


AACTGGGCAG 


TAAGGACCAA 


GCTCAAACTC 


8250 


ACTCCAATCC 


CGGCTGCGTC 


CCAGTTGGAT 


TTATCCAGCT 


GGTTCGTTGC 


8300 


TGGTTACAGC 


GGGGGAGACA 


TATATCACAG 


CCTGTCTCGT 


GCCCGACCCC 


8350 


GCTGGTTCAT 


GTGGTGCCTA 


CTCCTACTTT 


CTGTAGGGGT 


AGGCATCTAT 


8400 


CTACTCCCCA 


ACCGATGAAC 


GGGGAGCTAA 


ACACTCCAGG 


CCAATAGGCC 


8450 


ATCCTGTTTT 


TTTCCCTTTT 


TTTTTTTCTT 


1111111111 


TTTTTTTTTT 


8500 


TTTTTTTTTT 


TTCTCCTTTT 


TTTTTCCTCT 


TTTTTTCCTT 


TTCTTTCCTT 


8550 


TGGTGGCTCC 


ATCTTAGCCC 


TAGTCACGGC 


TAGCTGTGAA 


AGGTCCGTGA 


8600 


GCCGCTTGAC 


TGCAGAGAGT 


GCTGATACTG 


GCCTCTCTGC 


AGATCAAGT 





Patentanspruche 

1. Hepatitis C Virus (HCV) Zellkultursystem, das im wesentlichen eukaryontische Zellen umfaBt, die eingeschleu- 
stes HCV-spezifisches Genmaterial enlhalten, dadurch gekennzeichnet, daB die eukaryontischen Zellen humane 
Hepatomazellen sind und daB das eingeschleuste HCV-spezifische Genmaterial ein HCV-RNA-Konstrukt ist, das 
die HCV-spezifischen RNA-Abschnitte 5'NTR, NS3, NS4A, NS4B, NS5A, NS5B und 3'NTR und zusatzlich ein se- 
lektierbares Markergen (Selektionsgen) umfaBt. 

2. Zellkultursystem nach Anspruch 1, dadurch gekennzeichnet, daB die Hepatomazellen von einer handelsublichen 
Hepatomazellinie abstammen. 

3. Zellkultursystem nach Anspruch 1, dadurch gekennzeichnet, daB die Hepatomazellen aus einer Hepatomapri- 
marzellkultur gewonnen sind. 

4. HCV-RNA-Konstrukt, dadurch gekennzeichnet, daB es die HCV-spezifischen RNA-Abschnitte 5'NTR, NS3 
NS4A, NS4B, NS5A, NS5B und 3'NTR umfaBt. 

5. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, daB es die in Sequenzprotokoll SEQ ID NO: 1 
dargestellte Nukleotidsequenz umfaBt. 

6. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, daB es die in Sequenzprotokoll SEQ ID NO: 2 
dargestellte Nukleotidsequenz umfaBt. 

7. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, daB es die in Sequenzprotokoll SEQ ID NO: 3 
dargestellte Nukleotidsequenz umfaBt. 

8. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, daB es die in Sequenzprotokoll SEQ ID NO: 4 
dargestellte Nukleotidsequenz umfaBt. 

9. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, daB es die in Sequenzprotokoll SEQ ID NO: 5 
dargestellte Nukleotidsequenz umfaBt. 

10. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, daB die 3'NTR eine Nukleotidsequenz auf- 
weist, die aus der Gruppe der nachfolgend aufgelisteten Nukleotidsequenzen (a) bis (i) ausgewahlt ist: 
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(a) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTTTTT 
TTAGCTTTTTTTTTTTTCTTTTTTTTTGAGAGAGAGAGTCTCACTCTG 
TTGCCCAGACTGGAGT 

TTTTTAGTCT TTTTTTTTTC TTTTTTTTGA GAGAGAGAGT 
CTCACTCTGT TGCCCAGACT GGAGC 

(c) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTAATCTTT TTTTTTTTCT TTTTTTTTGA GAGAGAGAGT 
CTCACTCTGT TGCCCAGACT GCAGC 

(d) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAGTC TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG 
AGTCTCACTC TGTTGCCCAG ACTGGAGT 

(e) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG 
AGTCTCACTC TGTTGCCCAG ACTGGAGT 

(f) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TTGAGAGAGA 
GAGTCTCACT CTGTTGCCCA GACTGGAGT 

(g) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT CTTTTTTTTT GAGAGAGAGA 
GTCTCACTCT GTTGCCCAGA CTGGAGT 

(h) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTTAAT CTTTTTTTTT TTTTTCCTTT TTTTGAGAGA 
GAGAGTCTCA CTCTGTTGCC CAGACTGGAG T 

(i) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAATC TTTTTTTTTT TTTTCTTTTT TTTTTGAGAG 
AGAGAGTCTC ACTCTGTTGC CCAGACTGGA GT 

11. HCV-RNA-Konstrukt nach einem der Anspruche 4 bis 10, dadurch gekennzeichnet, daB das selektierbare Mar- 
kergen ein Resistenzgen und insbesondere eine Antibiolikaresistenzgen ist. 

12. HCV-RNA-Konstrukt nach einem der Anspruche 4 bis 10, dadurch gekennzeichnet, daB das selektierbare Mar- 
kergen ein Neomycinphosphotransferasegen ist. 

13. HCV-RNA-Konstrukt nach einem der Anspruche 4 bis 12, dadurch gekennzeichnet, daB das selektierbare Mar- 
kergen strangab warts der 5'NTR in die HCV-RNA integriert ist. 

14. HCV-RNA-Konstrukt nach einem der Anspruche 4 bis 1 3, dadurch gekennzeichnet, daB das selektierbare Mar- 
kergen uber ein Ribozym bzw. eine Erkennungsstelle fur ein Ribozym mit der HCV-RNA verbunden ist. 

15. HCV-RNA-Konstrukt nach einem der Anspruche 4 bis 14, dadurch gekennzeichnet, daB es ein integriertes Re- 
portergen aufweist. 

16. HCV-RNA-Konstrukt nach Anspruch 15, dadurch gekennzeichnet, daB das Reportergen ein Gen aus der 
Gruppe der Luziferasegene, dem CAT-Gen (Chloramphenicol-Acetayl-Transferase-Gen), dem lacZ-Gen (beta-Ga- 
laktosidasegen), der GFP-Gene (green- fluorescence-protein -Gene), dem GUS-Gen (Glukuronidasegen) und dem 
SEAP-Gen (Sezernierte-Alkalische-Phosphatase-Gen) ist. 

17. HCV-RNA-Konstrukt nach einem der Anspruche 4 bis 15, dadurch gekennzeichnet, daB deren Replikation die 
Expression eines (zellularen) Surrogatmarkergens beeinfiuBt. 

18. HCV-RNA-Konstrukt nach einem der Anspruche 15 bis 17, dadurch gekennzeichnet, daB das Resistenzgen 
derart in das offene Leseraster der HCV-RNA einidoniert ist, daB es erst nach einer proteolytischen Prozessierung in 
eine aktive Form uberfuhrbar ist. 

19. HCV-RNA-Konstrukt nach einem der Anspruche 15 bis 18, dadurch gekennzeichnet, daB das Reportergen und 
das selektierbare Markergen derart raumlich in dem Konstrukt angeordnet sind, daB sie gemeinsam ein Fusionspro- 
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tein exprimieren. 

20. Zellkultursystem nach einem der Anspriiche 1 bis 3, dadurch .gekennzeichnet, daB das HCV-RNA-Konstrukt 
ein Konstrukt gemaB wenigstens einem der Anspriiche 4 bis 19 ist. 

21. Zellkultursystem nach Anspruch 1, dadurch gekennzeichnet, daB die das HCV-RNA-Konstrukt enthaltenden 
Zellen bei der DSMZ, Braunschweig, BRD, unter der Hinterlegungsnummer DSM ACC2394 (Laborbezeichnung 
HuBI 9-13) hinterlegt sind. 

22. Verwendung eines Zellkultursy stems nach einem der Anspriiche 1 bis 3 oder 20 bis 21 und/oder eines HCV- 
RNA-Konstrukts nach einem der Anspriiche 4 bis 19 zur Herslellung und/oder Evaluierung und/oder Testung von 
Therapeutika und/oder Diagnostika zur Behandlung von insbesondere HCV-Infektionen. 

23. Verwendung eines Zellkultursystems nach einem der Anspriiche 1 bis 3 oder 20 bis 21 und/oder eines HCV- 
RNA-Konstrukts nach einem der Anspriiche 4 bis 19 zur Herstellung eines Impfstoffes gegen HCV-Infektionen. 

24. Verwendung eines HCV-RNA-Konstrukts nach einem der Anspriiche 4 bis 19 zur Herstellung einer leberzell- 
spezifischen Genfahre fiir die Gentherapie. 

25. HCV-RNA-Konstrukt nach einem der Anspriiche 4 bis 19, dadurch gekennzeichnet, daB es ein integriertes 
Fremdgen aufweist und dazu geeignet ist, dieses Fremdgen in eine Zielzelle einzuschleusen, die zur Expression die- 
ses Fremdgens geeignet ist. 
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